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“我 刚刚 读 完 前 三 章 的 内 容 ， 就 已 了 解 
如 何 用 一 种 编程 语言 实现 另 一 种 编程 语 
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Tom 把 原本 枯燥 的 主题 讲解 得 妙趣 横 
生 ， 同 时 又 极 具 启发 性 。” 
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本 书 封面 上 的 动物 是 碎 蜂 (拉丁 学 名 为 Hippopus hippopus)。 碎 里 因 其 形状 又 叫 马蹄 蛤 ， 
又 因 其 颜色 泛 红 称 为 草莓 蛤 。 碎 几 是 碎 碟 科 巨 蛤 亚 科 的 一 部 分 ， 而 碎 碟 科 又 是 乌 蛤 科 的 
一 部 分 。 碎 里 主要 生活 在 印度 洋 一 太平 洋 区 域 的 礁石 中 。 






































碎 蜂 有 两 个 相同 而 对 称 的 贸 合 部 。 它 还 有 着 深 深 的 蜡 和 与 众 不 同 的 红 白 图 案 。 碎 蜂 待 在 
一 个 地 方 使 用 虹 管 过 滤 周 围 的 水 之 后 ， 以 周围 的 浮游 生物 为 食 。 
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读者 对 象 

本 书写 给 那些 对 编程 语言 和 计算 理论 充满 好 奇 的 程序 员 ， 特 别 是 没有 正规 学 习 过 数学 或 者 
计算 机 科学 的 朋友 。 

如 果 你 对 涉及 程序 、 语 言 以 及 机 器 ， 且 能 开阔 思维 的 计算 机 科学 知识 感 兴趣 ， 却 被 常常 用 
于 阐明 它们 的 数学 语言 打击 的 话 ， 那 么 本 书 恰恰 是 你 需要 的 。 我 们 抛 开 复 杂 的 数学 符号 ， 
用 可 工作 的 代码 来 描述 理论 性 概念 ， 并 为 大 家 自行 探索 做 足 准 备 。 
























































本 书 读者 至 少 要 了 解 一 种 现代 编程 语言 ， 如 Ruby、Python、JavaScript、Java 或 者 C#。 书 
中 所 有 示例 程序 都 采用 Ruby 语言 编写 而 成 ， 但 了 解 其 他 语言 的 读者 亦 能 看 懂 。 注 意 ， 本 
书目 标 并 不 是 展示 Ruby 或 面向 对 象 设计 的 最 佳 实践 。 本 书 代 码 意 在 简明 清晰 ， 但 并 不 一 
定 都 容易 维护 ， 因 为 我 们 的 目标 是 使 用 Ruby 阐明 计算 机 科学 ， 而 不 是 用 计算 机 科学 讲解 
Ruby。 本 书 亦 非 教 材 或 者 百科 全 书 ， 所 以 并 没有 给 出 形式 论证 或 者 严密 的 证 明 ， 它 试图 让 
尔 能 接近 一 些 有 趣 的 思想 ， 启 发 你 更 深入 地 了 解 它们 。 


排版 约定 


本 书 中 使 用 以 下 排版 约定 。 


。 楷体 
用 于 标记 新 名 词 。 
































。 等 宽 字体 (constant width) 
用 于 程序 代码 ， 在 段落 中 用 于 表示 程序 的 组 成 部 分 ， 如 变量 或 函数 名 、 数 据 库 、 数 据 
类 型 、 环 境 变 量 、 语 句 、 关 键 字 。 














XI 


(constant width bold) 
其 他 应 该 由 用 户 输 入 的 内 容 。 


。 等 宽 粗 
命 








体 
令 或 是 
。 等 宽 斜 体 (constant width italic) 
应 该 由 用 户 提供 或 由 上 下 文 确定 的 值 。 
人 
心 提示 、 建 议 或 一 般 注 解 会 放 在 这 里 。 
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使 用 代码 


本 书 旨 在 帮助 读者 解决 实际 问题 。 也 许 你 需要 在 自己 的 程序 或 文档 中 用 到 本 书 中 的 代码 ， 
上 昌 除非 大 段 大 段 地 使 用 ， 否 则 不 必 与 我 们 联系 取得 授权 。 因 此 ， 用 本 书 中 的 几 段 代码 写 个 
程序 不 用 向 我 们 申请 许可 ， 但 是 销售 或 者 分 发 O'Reilly 图 书 随 附 的 代码 光盘 则 必须 事先 获 
得 授权 ， 引 用 书 中 的 代码 来 回答 问题 也 无 需 我 们 授权 ， 而 将 大 段 的 示例 代码 整合 到 自己 的 
产品 文档 中 则 必须 经 过 许可 。 


全 用 我 们 的 代码 时 ， 和 希望 你 能 标明 它 的 出 处 。 出 处 一 般 要 包含 书 名 、 作 者 、 出 版 商 和 书 
号 ， 例 如 : “Understanding Computation by Tom Stuart (O’Reilly). Copyright 2013 Tom Stuart, 
978-1-4493-2927-3”。 
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刚好 够 用 的 Ruby 基 础 














本 书 中 的 代码 全 部 使 用 Ruby 写成 。Ruby 是 一 种 简单 、 友 好 而 且 有 趣 的 编程 语言 。 因 为 
Ruby 清晰 与 灵活 ， 我 选择 了 它 ， 但 本 书 并 不 依赖 于 Ruby 专 有 的 特性 ， 所 以 这 些 示例 代码 
均 可 转换 成 你 喜欢 的 其 他 任何 语言 ， 特 别 是 像 Python 或 者 JavaScript 这 样 的 动态 语言 ， 如 
果 那 样 你 更 容易 理解 的 话 。 


所 有 的 示例 代码 都 兼容 Ruby 2.0 和 Ruby 1.9。 你 可 以 在 Ruby 官方 站 点 (http://www.ruby- 
lang.org/) 详细 了 解 Ruby， 还 可 以 下 载 一 份 官方 的 实现 。 
































我 们 会 快速 浏览 一 下 Ruby 的 特性 ， 并 集中 介绍 本 书 中 用 到 的 部 分 。 如 果 你 想 学 习 更 多 内 
容 ， 推 荐 从 O’Reilly 的 《Ruby 编程 语言 》(The Ruby Programming Language) 一 书 起 步 。 





和 
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1.1 交互 式 Ruby Shell 


Ruby 最 友好 的 一 个 特性 就 是 交互 式 控 制 台 IRB， 它 可 以 让 我 们 在 输入 Ruby 代码 后 立即 
看 到 执行 结果 。 本 书 将 广泛 使 用 IRB 与 所 写 的 代码 进行 交互 ， 并 探索 这 些 代码 是 如 何 工 
作 的 。 
在 开发 机 器 的 命令 行 中 输入 irb， 就 可 以 运行 RB 了 。IRB 显示 提示 符 >> 时 ， 表 明 当 前 可 


以 输入 一 个 Ruby 表达 式 。 输 入 一 个 表达 式 并 敲 回 车 键 之 后 ， 代 码 执行 ， 结 果 会 显示 到 提 
示 符 => 之 后 : 





2 
o 



































$ irb --simple-prompt 
>> 1+2 

| 

>> 'hello Wor1d .length 
=> 11 


本 书 中 只 要 出 现 提示 符 >> 和 =>， 就 是 在 与 IRB 交互 。 为 了 让 长 代码 更 易 读 ， 本 书 显示 它 


们 的 时 修 会 去 掉 提 示 符 ,但 是 仍然 假定 这 些 代码 已 经 输入 或 者 粘贴 进 了 IRB。 所 以 一 旦 本 
书 中 有 像 下 面 这 样 的 Ruby 代码 : 














2 
3 
x 


N= x 
ll ll ll 


yy 




















我 们 之 后 就 可 以 在 IRB 中 得 到 它们 的 结果 : 


> XZ 
=> 30 


1.2 值 


Ruby 是 一 种 面向 表达 式 的 语言 : 每 一 段 有 效 的 代码 执行 之 后 都 要 产生 一 个 值 。 下 面 快速 
浏览 一 下 Ruby 中 不 同类 型 的 值 。 


1.2.1 基本 数据 


如 我 们 所 料 ，Ruby 支持 布尔 型 (Boolean) 、 数 值 型 (number) 和 字符 串 (string)， 且 它们 
都 支持 常规 运算 : 

















>> (true 8& false) || true 
=> true 

>> (3 + 3) * (14 / 2) 

=> 42 

>> 'hello' + "World ' 

=> "hello world" 

>> "hello world' .slice(6) 
=> "WwW" 


一 个 Ruby 符号 表示 一 个 名 字 ， 是 一 个 轻 量 级 、 不 可 变 的 值 。 作 为 字符 串 的 简单 化 、 非 内 


存 密集 化 (less memory-intensive) 的 替身 ， 符 号 在 Ruby 中 被 广泛 使 用 一 一 通常 是 作为 散 
列表 中 的 键 使 用 (参见 1.2.2 节 )。 符 号 字面 量 的 开头 会 有 一 个 冒号 : 























>> :my_symbol 


=> :my_symbol 

>> :my_symbol == :my_symbol 

=> true 

>> :my_symbol == :another symbol 
=> false 
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特殊 值 nil 用 来 表示 不 存在 任何 有 用 的 值 : 


>> “hello world' .slice(11) 
=> Nil 


1.2.2 ”数据 结构 


Ruby 的 数组 字面 量 是 一 串 用 喜 号 分 隔 的 值 外 加 方 括号 的 形式 .: 

















>> numbers = ['zero', 'one', 'two'] 

=> "zero", "one", "two"] 

>> numbers[1] 

=> "one" 

>> numbers.push('three', 'four') 

=> ["zero", "one", "two", "three", "four"] 
>> numbers 

=> ["zero", "one", "two", "three", "four"] 
>> numbers.drop(2) 

=> ["two", "three", "four"] 








范围 (range) 表示 最 小 值 和 最 大 值 之 间 值 的 集合 。 范 围 的 写法 是 在 两 个 值 之 间 加 两 个 点 : 


>> ages = 18..30 

=> 18. .30 

>> ages.entries 

=> [18，19，20，21，22，23，24，25，26，27，28，29，30] 
>> ages.include?(25) 

=> true 

>> ages.include? (33) 

=> false 


一 个 散 列 (hash) 表示 一 个 集合 ， 其 中 每 个 值 都 与 一 个 键 相 关联 ， 一些 编 程 语言 把 这 种 数 
据 结 构 叫 作 “ 映 射 ”(map)、“ 字 典 ”(dictionary) 或 者 “关联 数组 ”(associative array)。 
一 个 散 列 字面 量 写成 大 括号 里 用 逗号 分 隔 的 “ 键 => 值 ”对 的 列表 : 



































>> fruit = { 'a' => 'apple', 'b' => 'banana', 'c' => 'coconut' } 
=> {"a"=>"apple", "b"=>"banana", "c"=>"coconut"} 

>> fruit['b'] 

=> "banana" 

>> fruit['d'] = 'date’ 

=> "date" 

>> fruit 

=> {"a"=>"apple", "b"=>"banana", "c"=>"coconut", "d"=>"date"} 


散 列 经 常 将 符号 用 作 键 ， 所 以 键 作为 符号 时 ，Ruby 提供 了 另 一 种 书写 键 值 对 的 语法 。 这 种 
写法 比 “ 键 => 值 ” 的 方式 更 为 紧凑 ,而 且 看 起 来 很 像 常 用 于 JavaScript 对 象 的 JSON 格式 : 


>> dimensions = { width: 1000, height: 2250, depth: 250 } 
=> {:width=>1000, :height=>2250，:depth=>250} 

>> dimensions[:depth] 

=> 250 
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1.2.3 proc 


个 proc 是 一 段 未 经 求 值 的 Ruby 代码 ， 根 据 需要 进行 传递 和 求 值 ; 
Rs “匿名 函数 ”或 “lambda 函数 ”。proc 字面 量 有 多 种 写法 ， 


“-> 参数 { 函数 体 }” 语 法 : 


>> multiply = -> x, y {x *y} 


=> #<Proc (lambda)> 

>> multiply.call(6, 9) 
=> 54 

>> multiply.call(2, 3) 


=> 6 


除了 .call 语法 ,i 


>> multiply[3, 4] 
=> 12 


1.3 控制 流 
Ruby 有 if、 


>> if 2<3 
'Jess" 
else 
"moTre 
end 
=> "less" 
>> quantify = 
-> number { 
case number 
when 1 
one 
when 2 
'a couple" 
else 
“many 
end 
} 
=> #<Proc (lambda)> 
>> quantify.call(2) 
=> "a couple" 
>> quantify.call(10) 
=> "many" 
>x=1 
= 
>> while x < 1000 
X=XxX*2 
end 
= :01 
>> x 
=> 1024 


case 和 while 表达 式 ， 











TI 





其 他 
其 





中 最 











还 可 以 使 用 方 括号 调用 proc: 


它们 都 以 通常 的 方式 工作 : 


言 把 这 种 语言 
紧凑 的 一 种 是 
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1.4 ”对象 和 方法 


Ruby 看 起 来 和 其 他 动态 编程 语言 很 像 ， 但 有 一 个 重要 的 区 别 : 每 个 值 都 是 一 个 对 象 ， 而 
且 对 象 彼此 之 间 靠 发 送 消息 进行 通信 '。 每 个 对 象 都 有 自己 的 方法 集合 ， 这 些 方法 决定 了 
它 如 何 响应 特定 的 消息 。 


一 个 消息 有 一 个 名 字 ， 并 且 根 据 需 要 可 以 有 一 些 参数 。 一 个 对 象 收 到 一 个 消息 的 时 候 ， 它 
对 应 的 方法 就 会 使 用 消息 中 的 参数 作为 自己 的 参数 执行 。 这 就 是 Ruby 完成 全 部 工作 的 方 
式 ; 其 至 “1+2” 都 意味 着 “使 用 参数 2 给 对 象 1 发送 一 个 叫 作 + 的 消息 ”， 而 对 象 1 有 一 
个 处 理 那 个 消息 的 方法 村 。 

















我 们 可 以 使 用 关键 字 def 定义 自己 的 方法 : 





>> 0 = Object.new 
=> #<0bject> 
>> def o.add(x, y) 
x+y 
end 
a>niI 
>> 0.add(2, 3) 
=> 5 





这 里 ， 我 们 通过 向 一 个 特殊 内 建 对 象 0bject 发 送 new 消息 来 新 建 一 个 对 象 ， 新 对 象 创建 之 
后 ， 在 其 上 定义 了 一 个 叫 #add 的 方法 。#add 方法 把 它 的 两 个 参数 加 在 一 起 ， 并 返回 结果 ， 
因为 一 个 方法 中 最 后 执行 的 表达 式 的 值 将 被 自动 返回 ， 所 以 并 不 需要 一 个 显 式 的 return。 
在 使 用 2 和 3 作为 参数 向 那个 对 象 发 送 add 消息 之 后 ，#add 方法 就 会 执行 ， 然 后 我 们 就 得 
到 了 想 要 的 结果 。 


通常 情况 下 ， 在 发 送 消息 时 要 写 上 接收 对 象 和 消息 名 并 用 圆 点 分 隔 〈 例 如 o.add) ， 但 是 
Ruby 会 一 直 追 踪 当 前 对 象 〈 叫 作 self)， 这 样 在 向 当前 对 象 发 送 消息 时 只 需 写 上 一 个 消息 
名 ， 接 收 对 象 可 以 不 必 显 式 写 出 来 。 例 如 ， 在 一 个 方法 定义 内 部 ， 当 前 对 象 总 是 接收 消息 
并 执行 此 方法 的 对 象 ， 因 此 在 一 个 特定 对 象 的 方法 内 部 ， 向 同一 个 对 象 发 送 其 他 消息 时 ， 
可 以 不 必 显 式 提 及 ， 
























































>> def 0.add_ twice(x, y) 
add(x，y) + add(x，y) 
end 
=> Nil 
>> 0.add twice(2, 3) 
=> 10 





注意 ， 我 们 在 #add_twice 方法 里 给 o 发 送 add 消息 时 ， 可 以 不 必 写 成 0.add(x，y)， 只 写 














注 1: 这 种 来 自 于 编程 语言 Smalltalk 的 风格 ， 对 Ruby 的 设计 有 直接 影响 。 
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add(x,y) 就 可 以 ， 这 是 因 


在 所 有 的 方法 定义 之 外 
消息 都 会 被 发 送 给 它 ; 














>> def multiply(a，b) 
a*b 
end 
=> Nil 
>> multiply(2, 3) 
=> 6 


1.5 “类 和 模块 


能 在 许多 对 象 之 间 共 享 方法 定义 是 件 很 便利 的 





为 o 是 接收 add_twice 消息 的 对 象 。 


， 当 前 对 象 是 一 个 叫 main 的 特殊 顶层 对 象 ， 任 何 没 有 指明 接收 者 的 
同样 ， 任 何 没有 指明 对 象 的 方法 定义 都 可 以 通过 main 使 用 : 








个 类 里 


个 类 的 实例 。 例 如 : 





>> class Calculator 
def divide(x, y) 


nil 

Cc = Calculator.new 
#<Calculator> 
Cc.class 

Calculator 
c.divide(10, 2) 

5 


此。 在 Ruby 中 我 们 可 以 把 方法 定义 放 到 一 


有 ， 然 后 通过 给 那个 类 发 送 new 消息 来 新 建 对 象 。 所 获得 的 对 象 是 包括 方法 在 内 的 这 





注意 ， 在 一 个 类 定义 里 定义 一 个 方法 会 把 方法 添加 到 那个 类 的 实例 里 ， 而 不 是 加 到 main 里 : 


>> divide(10，2) 


NoMethodError: Undefined method “divide' for main:Object 


一 个 类 可 以 通过 继承 来 引入 另 一 个 类 的 方法 定义 : 


>> class MultiplyingCalculator < Calculator 
def multiply(x, y) 


nil 

mc = MultiplyingCalculator.new 
#<MultiplyingCalculator> 
mc.class 

MultiplyingCalculator 
mc.class.superclass 

Calculator 





whe 
草 


>> mc.multiply(10, 2) 


=> 


20 


>> mc.divide(10, 2) 


=> 


子 类 中 


>> class BinaryMultiplyingCalculator < MultiplyingCalculator 


另 一 种 共 
进去 ; 


>> 


1.6 


下 面 是 














1.6.1 


就 像 我 们 已 经 看 到 的 那样 ，Ruby 仅 允 许 通 过 赋值 声明 局 部 变量 : 


>> 


5 


的 方法 可 以 通过 super 关键 字 调 用 超 类 的 同名 方法 : 


def multiply(x, y) 
result = super(x, y) 
result. to _s(2) 
end 
end 
nil 
bmc = BinaryMultiplyingCalculator.new 
#<BinaryMultiplyingCalculator> 
bmc.multiply(10, 2) 
"10100" 


k 享 方法 定义 的 方式 是 在 模块 (module) 中 声明 它们 ， 这 


module Addition 
def add(x, y) 
x+y 
end 
end 
nil 
class AddingCalculator 
include Addition 
end 
AddingCalculator 
ac = AddingCalculator.new 
#<AddingCalculator> 
ac.add(10, 2) 
12 


其 他 特性 


本 书 中 示例 代码 会 用 到 的 其 他 特性 。 


局 部 变量 和 赋值 





greeting = 'hello' 


=> "hello" 


六 


greeting 


=> "hello" 


样 它们 就 能 被 任意 类 包括 
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我 们 还 可 以 通过 数组 一 次 给 多 个 变量 并 行 赋值 : 


>> width, height, depth = [1000，2250，250] 
=> [1000，2250，250] 

>> height 

=> 2250 


1.6.2 ”字符 串 插值 
字符 串 可 以 使 用 单 引 号 也 可 以 使 用 双 引 号 表示 。 对 双 引 号 中 的 字符 串 ，Ruby 会 自动 用 表 
达 式 的 结果 替换 #{ 表达 式 }， 以 执行 字符 串 播 值 操作 。 





>> "hello #{'dlrow' .reverse}" 
=> "hello world" 





如 果 被 插入 的 表达 式 返 回 的 不 是 一 个 字符 串 类 型 的 对 象 ， 那 么 这 个 对 象 就 会 自动 收 到 一 个 
to_s 消息 以 返回 能 顶 禁 其 位 置 的 字符 串 。 我 们 可 以 借 此 控制 被 替换 对 象 的 展示 方式 : 














>> 0 = Object.new 
=> #<0bject> 
>> def o.to s 
"a_new object 

end 
=> nil 
>> "here is #{0}" 
=> "here is a new object" 


1.6.3 ”检查 对 和 象 
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当 IRB 需要 显示 一 个 对 象 ， 类 似 下 面 的 一 些 事情 就 会 发 生 : 向 这 个 对 象 发 送 inspect 消 
9 ， 然 后 这 个 对 象 返 回 自身 的 字符 串 表示 。Ruby 当中 所 有 对 象 默认 都 有 对 #inspect 的 合 
晶 实 现 ， 但 是 通过 提供 自己 的 定义 ， 我 们 就 可 以 控制 如 何在 控制 全 显示 对 象 


























>> 0 = 0bject.new 
=> #<0bject> 
>> def o.inspect 
" [my object] 
end 
=> nil 
>> 0 
=> [my object] 


1.6.4 打印 字符 串 
方法 #puts 对 每 个 Ruby 对 象 (包括 main) 都 可 用 ， 可 以 用 来 向 标准 输出 打印 字符 串 : 





>> x = 128 
=> 128 
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>> while x < 1000 
puts "x is #{x}" 
Xe 

end 

x is 128 

x is 256 

x is 512 

=> nil 


1.6.5 可 变 参 数 方法 (variadic method) 
定义 方法 时 可 以 使 用 * 运算 符 ， 以 支持 数目 可 变 的 参数 ; 


>> def join with commas(*words) 
words.join(', ') 
end 
=> nil 
>> join with commas('one', 'two', 'three') 
=> "one, two, three" 





一 个 方法 定义 只 能 有 一 个 可 变 参数 ， 而 常规 参数 放 到 可 变 参 数 的 前 后 都 可 以 : 


>> def join with commas(before, *words, after) 
before + words.join(', ') + after 
end 
=> Nil 
>> join with commas('Testing: 
=> "Testing: one, two, three.™" 


，'One', 'two', 'three'’, '.') 


在 发 送 消息 的 时 候 ，* 运算 符 还 可 以 把 每 一 个 数组 元 素 当 作 单 个 参数 处 理 : 





>> arguments = ['Testing: ', 'one', 'two', 'three', '.'] 
=> ["Testing: ",; "one", "two", "three", "."] 

>> join with commas(*arguments) 

=> "Testing: one, two, three.”" 


* 也 可 以 使 用 并 行 赋值 方式 : 














>> before, *words, after = ['Testing: ', 'one', 'two', 'three'’, '.'] 
=> ["Testing: ", "one"”, "two", "three", "."] 

>> before 

=> "Testing: " 

>> words 

=> ["one", "two", "three"] 

>> after 

大作 


1.6.6 ”代码 块 
代码 块 《block) 是 由 do/end 或 者 大 括号 围 住 的 一 段 Ruby 代码 。 方 法 可 以 带 一 个 隐 式 代码 
块 参数 ， 并 使 用 yield 关键 字 表示 对 代码 块 中 那 段 代码 的 调用 : 
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>> def do three times 
yield 
yield 
yield 
end 
=> nil 
>> do three times { puts 'hello' } 
hello 
hello 
hello 
=> nil 


代码 块 可 以 带 参 数 : 


>> def do three times 
yield( 'first') 
yield('second') 
yield('third') 

end 

3 的 

>> do _ three times { |n| puts "#{n}: hello" } 

first: hello 

second: hello 

third: hello 

=> nil 


yield 返回 执行 代码 块 的 结果 : 


>> def number names 
[yield('one'), yield('two'), yield('three')].join(', ') 
end 
=> Nil 
>> number names { |name| name.upcase.reverse } 
-> "ENO, OWT, EERHT" 


1.6.7” 枚 举 类 型 

Ruby 有 一 个 叫 作 Enumerable 的 内 置 模块 ， 被 数组 (Array)、 散 列表 (Hash)、 范 围 
(Range) 以 及 其 他 表示 值 的 集合 的 类 包含 。Enumerable 提供 的 方法 可 以 帮助 我 们 对 集合 进 
行 遍历 、 搜 索 和 排序 ， 其 中 的 很 多 方法 在 调用 时 都 可 以 带 上 一 个 代码 块 。 通 常 ， 代 码 块 
中 的 代码 会 根据 集合 中 的 一 些 值 或 全 部 值 来 运行 ， 以 此 承担 方法 的 一 部 分 工作 。 例 如 : 















































>> (1..10).count { |number| number.even? } 
信和 

>> (1..10).select { |number| number.even? } 
= [25 4，6，8， 10] 

>> (1..10).any? { |number| number < 8 } 

=> true 

>> (1..10).all? { |number| number < 8 } 

=> false 

>> (1..5).each do |number| 





if number.even? 
puts "#{number} is even" 
else 
puts "#{number} is odd" 
end 
end 


>> (1..10).map { |number| number * 3 } 
=> [35 6， 9，12，15， 18， 1 30] 


通常 ， 一 个 代码 块 带 有 一 个 参数 ， 并 向 此 参数 发 送 一 个 无 参 的 消息 ， 所 以 Ruby 提供 了 一 
种 缩写 方式 &:message， 这 比 写 代码 块 { |object| object.message } 更 为 简洁 

>> (1..10).select(&:even?) 

=> [2, 4, 6, 8,，10] 


>> ['one', 'two', 'three'].map(&:upcase) 
=> ["ONE", "TWO", "THREE"] 


有 的 代码 块 可 以 为 集合 中 的 每 个 值 生 成 一 个 数组 ，Enumerable 的 方法 加 at_map 能 把 这 些 
生成 的 结果 数组 连接 起 来 : 





>> ['one', 'two', 'three'].map(&:chars) 

=> [["o", ns "e"], [et "WwW", "0"]， [ts Ms ek "6 "e"]] 
>> ['one', 'two', 'three'].flat map(&:chars) 

> for, Mn, "er, tr ,on th, or ve "e"] 


TI 





还 有 一 个 有 用 的 方法 机 nject。 有 些 代码 块 会 处 理 集 合 中 的 每 个 
块 求 值 并 累积 成 一 个 最 终结 采 : 


，#inject 能 对 这 个 代码 











>> (1..10).inject(0) { |result, number| result + number } 
=> 55 

>> (1..10).inject(1) { |result, number| result * number } 
=> 3628800 


>> ['one', 'two', 'three'].inject('Words:') { |result, word| "#{result} #{word}"” } 
=> "Words: one two three" 


1.6.8 结构 体 


结构 体 (Struct) 是 Ruby 中 一 个 特殊 的 类 ， 它 的 工作 是 生成 其 他 类 。 根 据 传 进 Struct. 
new 的 每 个 属性 名 ，Struct 产生 的 类 会 包含 相应 的 获取 方法 和 设置 方法 。 要 使 用 由 结构 体 
生成 的 类 ， 常 见方 式 是 对 其 进行 子 类 化 ， 我 们 可 以 给 子 类 起 个 名 字 ， 然 后 在 里 边 定义 其 他 
任意 的 方法 。 例 如 ， 为 了 创建 一 个 拥有 属性 x 和 y， 名 字 是 Point 的 类 ， 可 以 写成 : 























class Point “ Struct.new(:x, :y) 
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def +(other _ point) 
Point.new(x + other point.x, y + other point.y) 
end 


def inspect 
"#<Point (#{x}, #{y})>" 
end 
end 





现在 我 们 可 以 创建 Point 的 一 些 实例 ， 然 后 在 IRB 中 进行 检查 ， 并 给 它们 发 送 消 息 : 


和 我 们 定义 的 所 有 方法 一 样 ，Point 实例 会 响应 消息 x 和 x=， 以 便 获 取 和 设置 属性 x 的 值 。 


>> a = Point.new(2, 3) 
=> #<Point (2, 3)> 

>> b = Point.new(10, 20) 
=> #<Point (10, 20)> 
>a+b 
=> #<Point (12, 23)> 

















y 和 y= 与 Xx 和 x= 的 情况 类 似 : 


>> 9.X 

=> 2 

>> a.X = 35 

=> 35 

>a+b 

=> #<Point (45, 23)> 





由 Struct.new 生成 的 类 还 有 其 他 实用 功能 ， 像 判断 是 否 相等 的 方法 #= 的 实现 ， 就 可 以 比 
较 两 个 结构 体 的 属性 是 否 相等 : 


>> Point.new(4, 5) == Point.new(4, 5) 
=> true 

>> Point.new(4, 5) == Point.new(6, 7) 
=> false 


1.6.9 ”给 内 置 对 象 扩 展 方法 (Monkey Patching) 
我 们 随时 都 可 以 给 类 或 模块 增加 方法 。 这 是 一 个 强大 的 特性 ， 通 常 叫 作 Monkey Patching， 
可 以 让 我 们 扩展 已 有 类 的 行为 : 


>> class Point 

def -(other point) 

Point.new(x - other point.x, y - other point.y) 
end 
end 

=> Nil 
>> Point.new(10, 15) - Point.new(1, 1) 
=> #<Point (9, 14)> 





我 们 甚至 可 以 扩展 Ruby 内 置 的 类 : 


>> class String 

def shout 

upcase + “1 
end 
end 

=> nil 
>> 'hello world' .shout 
=> "HELLO WORLD!I!1!" 


1.6.10 ”定义 常量 
Ruby 支持 一 种 叫 作 常量 的 特殊 变量 。 一 般 而 言 ， 常 











(Ruby 并 不 会 阻止 一 个 常量 被 重新 赋值 ， 但 它 会 产生 警告 ， 以 便 我 们 知道 自己 做 
任何 以 大 写字 母 开头 的 变量 都 是 常量 。 可 以 在 顶层 或 者 在 一 个 类 或 模块 中 定义 新 的 常量 : 





>> NUMBERS = [4, 8, 15, 16, 23, 42] 

=> [4, 8, 15, 16, 23, 42] 

>> class Greetings 
ENGLISH = "hello 
FRENCH "bonjour" 
GERMAN 'guten Tag’ 

end 

=> "guten Tag" 

>> NUMBERS.1ast 

=> 42 

>> Greetings: :FRENCH 

=> "bonjour" 





类 和 模块 的 名 字 总 是 以 大 写字 母 开 头 ， 所 以 类 和 模块 的 名 字 也 是 常量 。 


1.6.11 删除 常量 











旦 创建 ， 就 不 能 再 被 重新 赋值 。 


错 了 事 。) 


在 使 用 IRB 进行 探索 时 ， 如 果 我 们 想 重 新 定义 某 个 类 或 模块 ， 而 不 是 要 扩展 它们 ， 实 用 的 


做 法 是 让 Ruby 完全 忽略 该 常量 。 一 个 顶层 常量 可 以 通过 给 0bject 发送 消息 remove const 





来 删除 ， 同 时 还 要 把 常量 名 作为 符号 (symbol) 对 象 传 进 去 : 


>> NUMBERS .1ast 

=> 42 

>> Object.send(:remove const, :NUMBERS) 
=> [4, 8, 15, 16, 23, 42] 

>> NUMBERS. last 

NameError: uninitialized constant NUMBERS 
>> Greetings: :GERMAN 

=> "guten Tag" 

>> Object.send(:remove const, :Greetings) 
=> Greetings 

>> Greetings: :GERMAN 



































的 Ruby 基 


础 | 13 


NameError: uninitialized constant Greetings 


只 能 使 用 0bject.send(:remove_const，: 常量 名 ) 而 非 0bject.remove_const(: 常量 名 )， 
因为 remove_const 是 一 个 私有 (private) 方法 ， 7 0bject 类 的 自身 内 部 发 送 
来 调用 ;使 用 0bject.send 时 ， 我 们 可 以 暂时 跳 过 这 个 限制 。 
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第 一 部 分 


程序 和 机 器 

















什么 是 计算 ? 这 个 词 对 于 不 同人 来 说 意思 不 同 ， 但 是 每 个 人 都 会 赞同 这 样 一 种 理解 : 在 一 
台 计 算 机 读 取 程序 、 运 行程 序 、 读 入 一 些 输入 ， 并 且 最 后 产生 一 些 输出 的 时 候 ， 肯 定 发 生 
了 某 种 计算 。 因 此 我 们 可 以 这 样 认 为 : 计算 就 是 指 计算 机 所 做 的 事情 。 


为 了 创造 一 个 环境 让 这 种 熟悉 的 计算 发 生 ， 需 要 三 个 基本 要 素 : 


。 一 台 机 器 ， 能 够 执行 计算 ， 
。 一 种 语言 ， 用 来 编写 这 台 机 器 能 够 理解 的 指令 ， 
。 一 个 程序 ， 用 这 种 语言 编写 ,描述 机 器 应 该 具体 执行 哪些 计算 。 











这 部 分 内 容 就 是 关于 机 器 、 语 言 和 程序 的 : 它们 是 什么 ， 行 为 如 何 ， 我 们 如 何 对 其 建 模 并 
展开 研究 ， 以 及 如 何 利用 它们 完成 实际 工作 。 通 过 研究 这 三 要 素 ， 我 们 将 对 计算 的 含义 以 
及 它 是 如 何 发 生 的 有 更 好 的 理解 。 


在 第 2 章 ， 我们 将 设计 和 实现 一 种 简单 的 编程 语言 ， 并 用 儿 种 不 同 的 方法 来 研究 这 种 语言 
的 含义 。 理 解 了 一 种 语言 的 含义 ， 就 可 以 把 一 段 没 有 生命 的 源 代码 和 一 个 动态 的 、 正 在 执 
行 的 进程 联系 起 来 。 每 一 种 方法 都 能 带 给 我 们 一 个 把 程序 运行 起 来 的 特定 策略 ， 而 我 们 最 
终 将 用 几 种 不 同 的 方式 来 实现 同一 语言 。 














我 们 会 发 现 编程 是 一 门 把 一 个 准确 定义 的 结构 组 装 起 来 的 艺术 ， 这 个 结构 能 拆卸 、 分 析 ， 
并 最 终 被 一 台 机 器 解释 执行 从 而 完成 一 次 计算 。 更 重要 的 是 ， 我 们 还 会 发 现实 现 编程 语言 
既 简单 又 有 趣 : 尽管 语法 分 析 、 解 释 和 编译 看 起 来 很 下 人 ， 但 实际 摆弄 起 来 其 实 会 感觉 简 
单 又 愉快 。 








如 果 没 有 机 器 来 运行 ， 程 序 本 身 没 有 多 大 用 处 。 所 以 在 第 3 章 里 ， 我 们 会 设计 非常 简单 的 
机 器 ， 以 便 执行 基本 的 、 硬 编码 的 任务 。 有 了 这 个 简单 的 基础 ， 我 们 在 第 4 章 会 向 更 复杂 
的 机 器 努力 前 进 ， 并 在 第 5 章 介 绍 如 何 设计 能 被 软件 控制 的 通用 计算 装置 。 

















到 第 二 部 分 的 时 候 ， 我 们 将 了 解 拥有 计算 能 力 的 机 器 的 全 景 : 一 些 机 器 拥有 非常 有 限 的 能 
力 ， 一 些 机 器 用 处 更 大 但 仍然 令 人 诅 形 地 有 一 些 限 制 ， 最 后 还 有 一 些 机 器 是 我 们 知道 如 何 
构建 的 最 强大 的 机 器 。 








第 2 章 


程序 的 含义 





不 准 想 ， 快 点 ! 就 像 直觉 地 把 手指 向 月 亮 。 记 住 ， 反应 慢 了 就 只 能 看 到 手指 ， 而 
绝 不 能 看 到 月 亮 的 光华 了 。 
一 一 电影 《龙争虎斗 》， 李 小 龙 


编程 语言 ， 以 及 我 们 用 编程 语言 所 写 的 程序 ， 这 些 都 是 软件 工程 师 工作 的 基础 。 我 们 用 编 
程 语言 和 程序 阐明 复杂 的 想法 ， 并 在 彼此 之 间 交 流 这 些 想法 ， 当 然 最 重要 的 是 在 计算 机 中 
实现 这 些 想法 。 就 像 人 类 社会 没有 自然 语言 就 难以 运转 一 样 ， 全 球 的 程序 员 都 依赖 编程 语 
言传 递 和 实现 自己 的 想法 ， 每 一 个 有 成 效 的 程序 都 是 实现 更 高 层 思想 的 基础 。 




















程序 员 是 注重 实际 的 生物 。 程 序 员 经 常 通过 阅读 文档 、 学 习 教 程 、 研 究 现 有 的 程序 以 及 修 
改 自 己 的 简单 程序 来 学 习 新 的 编程 语言 ， 而 不 会 过 多 地 思考 那些 程序 有 什么 含义 。 有 时 
候 ， 学 习 的 过 程 就 像 试 错 : 我 们 试图 通过 看 例子 和 文档 来 理解 一 个 语言 片段 ， 然 后 会 努力 
用 这 种 语言 写 点 什么 ， 之 后 所 有 问题 就 都 爆发 了 ， 而 我 们 只 得 回头 重 试 ， 直 到 成 功 组 装 了 
一 个 大 部 分 情况 下 都 能 工作 的 东西 。 随 着 程序 支持 的 计算 机 和 系统 越 来 越 复 杂 ， 它 们 很 容 
易 被 看 成 是 一 些 难 懂 的 符 尖 ， 这 些 符 吕 只 代表 它们 自己 而 看 不 出 有 什么 售 勾 ， 并 且 它 们 只 
是 偶尔 才能 正常 工作 。 











但 是 计算 机 编程 不 单 是 与 程序 相关 ， 重 要 的 是 程序 员 要 表达 的 思想 。 程 序 只 是 思想 的 静态 
表示 ， 是 曾经 存在 于 程序 员 脑 海中 的 某 个 结构 的 快照 。 程 序 是 因为 有 了 含义 才 值 得 写 下 
来 。 那 么 是 什么 把 代码 和 它 的 含义 连接 在 一 起 呢 ?” 除 了 说 “ 它 做 了 该 做 的 事 ”"， 怎 样 才能 
将 一 个 程序 的 含义 说 得 更 具体 一 点 呢 ?” 本 章 ， 你 将 会 看 到 一 些 确定 计算 机 程序 含义 的 方 
法 ， 了 解 如 何 给 那些 死板 的 “静态 快照 ”注入 生命 气息 。 











2.1 “含义 ”的 含义 

在 语言 学 中 ， 语 义学 (semantics) 研究 的 是 单词 和 它们 含义 之 间 的 关系 : 单词 “dog” 是 
纸 上 一 些 符号 的 组 合 ， 或 是 由 某 个 人 声带 引起 的 一 系列 空气 振动 ， 这 与 真正 的 狗 或 者 通常 
意义 上 狗 的 概念 极为 不 同 。 语 义 不 止 关注 抽象 含义 本 身 的 基本 性 质 ， 还 关 广 具 体 的 记号 如 
何 与 它们 的 抽象 含义 关联 起 来 。 

计算 机 科学 里 ， 形 式 语 义学 注重 找到 确定 程序 难以 捉摸 的 含义 的 方法 ， 并 利用 这 些 方法 发 
现 或 者 证 明 编程 语言 中 有 趣 的 东西 。 形 式 语义 学 得 到 了 广泛 应 用 ， 从 定义 新 的 语言 和 进行 
译 优化 这 种 具体 的 应 用 ， 到 构造 程序 正确 性 的 数学 证 明 这 样 更 抽象 的 领域 不 一 而 足 。 


为 了 完整 地 定义 编程 语言 , 我 们 需要 : 语法 ,描述 程序 看 起 来 是 什么 样 的 ; 语义 (semantics) ， 
描述 程序 的 含义 。 


许多 语言 都 没有 官方 的 书面 规范 ， 而 只 有 一 个 可 用 的 解释 器 或 者 编译 器 。Ruby 本 身 算是 
“ 靠 实现 规范 ”这 一 类 : 尽管 有 很 多 关于 Ruby 应 该 如 何 工作 的 书 和 教程 ， 但 这 些 资 料 的 最 
终 源头 都 是 松本 行 弘 先生 (Matz) 的 Ruby 解释 器 (MRI，Matz's Ruby Interpreter) ， 这 是 
Ruby 的 参考 实现 。 如 果 任 何 一 份 Ruby 文档 与 MRI 的 实际 行为 不 一 致 ， 那 必然 是 文档 错 
了 ; JRuby、Rubinius 以 及 MacRuby 这 些 第 三 方 实现 都 只 能 努力 地 精准 模拟 MRI 的 行为 ， 
只 有 如 此 ， 它 们 才 可 以 声称 自己 与 Ruby 语言 有 效 地 兼容 。 其 他 像 PHP 和 Perl 5 这 样 的 语 
言 ， 也 使 用 了 这 种 以 实现 为 主导 的 语言 定义 方法 。 

另 一 种 描述 编程 语言 的 方法 ， 就 是 写 一 份 平实 的 官方 规范 (一 般 是 英语 的 )。C++、Java 以 
及 ECMAScript (JavaScript 的 标准 版 本 ) 都 使 用 了 这 种 方法 : 这 些 语言 的 标准 化 通过 由 专 
家 委员 会 写成 的 、 与 实现 无 关 的 文档 来 完成 ， 而 且 会 存在 很 多 与 这 些 标准 兼容 的 实现 。 比 
起 只 是 依赖 于 一 个 参考 实现 ， 用 官方 文档 规范 定义 一 种 语言 更 为 严谨 : 这 样 所 做 的 设计 决 
策 更 有 可 能 是 经 过 深思 熟 虑 、 进 行 理性 选择 之 后 的 ， 而 不 是 某 一 个 特定 实现 的 意外 结果 。 
但 是 ， 规 范 通常 非常 难 懂 ， 而 且 很 难 讲 规范 中 是 不 是 含有 矛盾、 距 漏 和 有 歧义 的 地 方 。 特 
别 是 一 份 英语 规范 没有 形式 化 的 方法 可 以 进行 推导 ， 我 们 上 只 能 完整 彻底 地 阅读 规范 ， 大 量 
地 思考 ， 然 后 寄 希 望 于 这 样 就 可 以 掌握 所 有 的 前 因 后 果 。 


说 和 
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Ruby 1.8.7 的 规范 确实 存在 ， 甚 至 已 经 被 接受 为 ISO 标准 了 (ISO/IEC 

心 30170) “。 尽 管 mruby 工程 (https://github.com/mruby/mruby) 尝试 构建 一 份 

避 ， 轻 量 级、 嵌入 式 的 Ruby 实现 ， 并 且 明 确 声明 将 与 ISO 标准 而 不 是 MRI 兼 
容 ， 但 MRI 仍然 被 认为 是 Ruby 语言 由 实现 定义 的 权威 规范 。 
































注 1: 在 讨论 编程 语言 理论 的 环境 下 ， 单 词 semantics 通常 被 当 作 单数 对 待 ， 我们 通过 为 语言 赋予 语义 来 描 














述 这 种 语言 的 含义 。 
注 2: 尽管 访问 ISO/IEC 30170 需要 支付 费用 ， 但 这 一 规范 的 一 份 早期 草案 可 以 免费 下 载 : http://ipa.go.jp/ 
osc/english/ruby/。 
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第 三 种 方法 是 使 用 形式 语义 学 中 的 数学 方法 准确 摘 述 编程 语言 的 含义 。 它 的 目标 是 不 仅 能 
用 适合 系统 分 析 其 至 自动 化 分 析 的 格式 写 出 规范 ， 还 能 保证 其 完全 没有 歧义 ， 这 样 就 可 以 
对 规范 是 否 一 致 、 是 否 舍 有 冲突 ， 以 及 是 否 有 了 玻 漏 进行 全 面 检查 。 在 介绍 如 何 处 理 语 法 之 
后 ， 我 们 将 会 看 到 语义 规范 的 这 些 形式 化 方法 。 


2.2 ”语法 
传统 的 计算 机 程序 是 长 长 的 字符 串 。 每 一 种 编程 语言 都 有 一 系列 规则 ， 描 述 在 那 种 语言 
什么 样 的 字符 串 被 认为 是 有 效 程序 。 这 些 规 则 定义 了 这 种 语言 的 语法 。 

















通过 语言 的 语法 规则 ， 我 们 能 把 像 y = x + 1 这 样 可 能 有 效 的 程序 与 像 >/;x:1@4 这 样 训 
无 意义 的 字符 串 区 分 开 。 语 法 规则 还 为 如 何 阅读 一 些 具 有 二 义 性 的 程序 提供 了 有 用 信息 ， 
例如 运算 符 优 先 级 的 规则 能 够 自动 判定 1 + 2 * 3 按 其 本 意 1 + (2 * 3) 处 理 ， 而 不 是 按 
1+ 2) * 3 处理。 
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一 
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然 ， 计 算 机 程序 的 预期 用 途 是 被 计算 机 读 取 ， 而 要 读 程 序 就 需要 语法 解析 器 : 这 个 分 析 
器 程序 能 够 读 取 代表 程序 的 字符 串 ， 根 据 语法 规则 检查 它 是 否 有 效 ， 然 后 把 它 转换 成 一 个 
适合 被 进一步 处 理 的 结构 化 表示 。 


有 各 种 各 样 的 工具 能 把 一 种 语言 的 语法 规则 自动 转换 成 一 个 语法 解析 器 。 有 具体 如 何 对 这 些 
规则 进行 定义 ， 以 及 把 它们 转 成 可 用 语法 解析 器 的 技术 ， 并 不 是 本 章 的 讲解 重点 〈2.6 证 
进行 了 简单 介绍 )， 但 总 体 来 讲 一 个 语法 解析 器 应 该 读 入 像 y = x + 1 这样 的 字符 串 ， 然 后 
把 它 转换 成 抽象 语法 树 (AST)。 抽 象 语法 树 是 源 代码 的 一 种 表示 ， 去 掉 了 空格 之 类 的 无 关 
细节 ， 而 只 关注 程 序 的 分 层 结构 。 


语法 关心 的 只 是 程序 的 表面 是 什么 样 的 ， 而 不 是 它 的 含义 。 程 序 有 可 能 语法 正确 但 没有 任 
何 实际 意义 。 例 如 ,程序 y = x + 1 本身 可 能 没有 任何 意义 ， 因 为 并 没有 事先 说 明 x 是 什 
么 ， 而 程序 z = true + 1 可 能 会 在 运行 时 候 报错 ， 因 为 它 试 图 在 一 个 布尔 型 值 上 加 数字 。 
(当然 ， 这 依赖 于 具体 编程 语言 的 其 他 属性 。) 

正如 我 们 所 料 ， 能 说 明 如 何 把 一 种 编程 语言 的 语法 与 这 个 语法 暗 售 的 语义 对 应 起 来 的 “ 唯 
一 正 途 ”并 不 存在 。 实 际 上 ， 关 于 程序 的 含义 有 几 种 不 同 的 研究 方法 ， 它 们 都 在 形式 化 
(formality)、 抽 象 度 (abstraction)、 可 表达 性 (expressiveness) 和 实际 效率 (efficiency) 
之 间 做 了 权衡 。 在 接 下 来 的 几 节 里 ， 我 们 将 看 到 这 些 主要 的 形式 化 方法 ， 并 了 解 它 们 之 间 
的 联系 。 


2.3 ”操作 语义 


考虑 程序 含义 的 最 实际 方法 是 思 萎 它 做 了 些 什 么 : 在 运行 程序 的 时 候 ， 我 们 期 望 发 生 什么 







































































呢 ? 在 运行 时 编程 语言 中 不 同 的 结构 都 是 如 何 表现 的 ?把 它们 放 到 一 起 组 成 更 大 的 程序 时 
会 是 什么 效果 ? 


这 是 操作 语义 学 (operational semantic) 的 基础 ， 这 种 方法 为 程序 在 某 种 机 器 上 的 执行 定义 
一 些 规则 ， 以 此 来 捕捉 编程 语言 的 含义 。 这 个 机 器 常常 是 一 种 抽象 的 机 器 : 为 了 解释 这 种 
语言 所 写 的 程序 如 何 执 行 而 设计 出 来 的 一 个 想象 的 、 理 想 化 的 计算 机 。 为 了 更 好 地 捕获 编 
程 语言 的 运行 时 行为 ， 通 常 需要 针对 不 同 种 类 的 编程 语言 设计 不 同 的 抽象 机 器 。 

有 了 操作 语义 ， 我们 可 以 朝 着 严谨 而 准确 地 研究 语言 中 特定 结构 的 目标 前 进 了 。 用 英语 写 
成 的 语言 规范 可 能 暗藏 着 二 义 性 ， 并 且 可 能 遗漏 边缘 情况 ， 但 一 个 形式 化 的 操作 性 规范 不 
会 如 此 ， 为 了 令 人 信服 地 传达 语言 的 行为 ， 它 必须 明确 而 且 无 二 义 性 。 






































2.3.1 小 步 语 义 

那么 ， 我 们 如 何 设计 一 台 抽 象 机 器 ， 并 使 用 它 定义 一 种 编程 语言 的 操作 语义 呢 ? 一 种 方法 
就 是 假想 一 台 机 器 ， 用 这 人 台 机 器 直接 按照 这 种 语言 的 语法 进行 操作 一 小 步 一 小 步 地 对 其 进 
行 反复 规约 ， 从 而 对 一 个 程序 求 值 。 不 管 最 后 得 到 的 结果 含义 是 什么 ， 我 们 每 一 步 都 能 让 
程序 更 接近 最 终结 果 。 
这 种 小 步 规约 类 似 于 对 代数 式 求 值 的 方式 。 例 如 ， 为 了 对 (1x2) + (3 x4) 求 值 ， 我 们 知道 
应 该 : 

(1) 执行 左 侧 的 乘法 (1 x2 变 成 了 2)， 这 样 表达 式 就 规约 成 了 2 + (3 Xx4); 
(CO) 执行 右 侧 的 乘法 (3x4 变 成 了 12) ， 这 样 表 达 式 规约 成 了 2 + 12; 

(3) 执行 加 法 (2 + 12 变 成 了 14) ， 最 终 得 到 14。 



























































我 们 可 以 认为 14 就 是 结果 ， 因 为 通过 上 面 步骤 已 经 不 能 再 进一步 规约 了 ;我们 认为 14 是 
一 个 特殊 代数 表达 式 ， 它 是 一 个 值 ， 有 自己 的 含义 ， 不 需要 进一步 的 努力 了 。 


把 如 何 进行 每 一 小 步 的 规约 写成 形式 化 规则 ， 这 个 非 形式 化 的 过 程 就 可 以 转换 成 一 个 操 
作 语 义 。 这 些 规则 本 身 需要 用 某 种 语言 (元 语言 ) 写 下 来 ， 而 这 种 语言 通常 是 数学 符号 。 


本 章 ， 我 们 将 探索 一 个 玩具 级 编程 语言 的 语义 ， 姑 且 将 这 种 语言 叫 作 Simple 。 























Simple 的 小 步 语义 (small-step semantic) 的 数学 化 描述 如 下 所 示 : 


注 3; 你 可 以 把 它 看 成 简单 命令 式 语言 (simple imperative language) 的 缩写 。 





20 | 第 2 章 


(e1,0) we el (e2,0) ~e €2 


(el + e2,0) we el + e2 (V1 + €2,0) re V1 + C2 
Ne" ifn 三 Nl1 二 Nn 
(nl + n2,0) en 1 2 


(e1,0) we 1 (e2,0) we €2 
{€1 * €2,0) ve 61 本 C2 (V1 * €2,0) ~+e V1 * 65 


一 一 一 一 一 让 交 王 TDlIX7n2 
(ml * n2,0) en 








(el < €2,0) we el<e2 (ol <€2,0) we v1 < 6 
i 人 
人 if ni < ?2 if ni > nz 


(nl < n2,0) ~e false 


{0) Se or) ifwe dom(o) 


(eay ee! 


(T=€,0) ~s (T= e',0) (T=V,0) ~ (do-nothing, olz 上 1)) 


{€,0) ee! 
{if (e) { sl } else { s2 },0) ~ (if (e’) { 81 } else { s2 },0) 





(if (true) { sl } else { sz },0) ~ (31,0) (if (false) { sl } else { 52 },0) ~ (52,0) 


(31,0) vs (31,0") 


(31; 82,0) os (31; 52,0) {do-nothing; s2,0) ~s (52,0) 








{while (e) {s },0) ~ (if (e) { 8; while (e) {5s}}else {do-nothing },o) 


从 数学 上 讲 ， 这 是 一 个 推理 规则 的 集合 ， 它 定义 了 基于 Simple 抽象 语法 树 的 一 个 规约 关系 。 
实际 点 儿 讲 ， 这 是 一 堆 怪 异 的 符号 ， 关 于 计算 机 程序 的 含义 它 没 有 讲 任 何 能 让 人 理解 的 东西 。 


我 们 不 会 试图 直接 理解 这 种 形式 化 的 符号 ， 而 是 研究 如 何 用 Ruby 编写 同样 的 推导 规则 。 
对 程序 员 来 说 使 用 Ruby 做 元 语言 更 容易 理解 ， 而 且 这 样 还 有 一 个 优点 ， 就 是 这 些 规 则 可 
以 执行 ， 我 们 能 看 到 它们 是 如 何 工作 的 。 











-> 











我 们 并 不 打算 尝试 用 “ 靠 实现 来 规范 ”的 方式 描述 Simple 的 语义 。 使 用 Ruby 
而 不 是 用 数学 符号 来 描述 小 步 语义 ， 主 要 是 为 了 使 描述 更 容易 被 人 们 所 理解 。 
最 终 得 到 一 个 这 种 语言 的 可 执行 实现 ， 只 是 这 么 做 的 额外 好 处 。 








使 用 Ruby 有 一 大 缺点 : 这 是 在 使 用 一 种 更 复杂 的 语言 解释 一 种 简单 的 语言 ， 
从 哲学 上 来 说 这 可 能 很 失败 。 我 们 应 该 记 住 ， 数 学 化 的 规则 是 语义 的 权威 描 
述 ， 而 使 用 Ruby 只 是 为 了 更 容易 地 理解 这 些 规 则 的 含义 。 











1. 表达 式 

首先 来 研究 一 下 Simple 语言 中 表达 式 的 语义 。 规 则 将 作用 于 这 些 表达 式 的 抽象 语法 树 ， 所 
以 我 们 必须 把 Simple 表达 式 表示 成 Ruby 对象。 要 做 到 这 一 点 ， 一 种 方式 就 是 为 Simple 
语法 中 每 一 种 不 同 的 元 素 都 定义 一 个 Ruby 类， 包括 数字 (number)、 加 法 (add) 、 乘 法 
(multiply) 等 ， 然 后 把 每 一 个 表达 式 表 示 成 由 这 些 类 的 实例 构成 的 一 棵 树 。 


例如 ， 下 面 是 Number、Add 和 Multiply 三 个 类 的 定义 : 


class Number < Struct.new(:value) 
end 


class Add «< Struct.new(:left, :right) 
end 


class Multiply < Struct.new(:left, :right) 
end 


实例 化 这 些 类 来 手工 构造 抽象 语法 树 : 


>> Add.new( 
Multiply.new(Number.new(1), Number.new(2)), 
Multiply.new(Number.new(3), Number.new(4)) 
) 
=> #<struct Add 
left=#<struct Multiply 
eft=#<struct Number value=1>, 
right=#<struct Number value=2> 
>， 
right=#<struct Multiply 
eft=#<struct Number value=3>, 
right=#<struct Number value=4> 
> 
> 





注 羽 


当然 ， 最 终 我 们 想 通过 一 个 语法 解析 器 自动 构建 这 些 树 。2.6 节 将 介绍 如 何 
心 4 ， 完 成 这 件 事情 。 
[SN 
三 个 类 (Number、Add 和 Multiply) 都 继承 了 Struct 对 提 nspect 的 通用 定义 ， 所 以 在 IRB 
中 它们 实例 的 字符 串 表 示 会 个 有 大 量 不 重要 的 细节 。 为 了 方便 在 IRB 中 查看 抽象 语法 树 的 
内 容 ， 我 们 将 覆盖 每 个 类 的 村 nspect 方法 “， 让 它 返 回 自 定义 的 字符 串 表示 : 



































class Number 
def to s 
value.to s 
end 


def inspect 
"«#{self}»" 





注 4: 为 了 让 代码 保持 简单 ， 我 们 将 抑制 住 把 公共 代码 提取 到 超 类 或 者 模块 中 的 欲望 。 
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end 
end 


class Add 
def to s 
"#{left} + #{right}" 


end 


def inspect 
"«#{self}»" 


end 
end 


class Multiply 
def to s 
"#{left} * #{right}" 


end 


def inspect 
"«#{self}»" 


end 
end 


这 样 每 个 抽象 语法 树 都 将 在 IRB 中 以 Simple 源 代码 的 形式 呈现 ， 外 边 会 加 上 书 名 号 («») 
以 便 与 正常 的 Ruby 值 区 分 。 
>> Add.new( 


Multiply.new(Number.new(1), Number.new(2)), 
Multiply.new(Number.new(3), Number.new(4)) 


) 





=> «1 *2+3*4» 
>> Number.new(5) 


=> «D5» 


全 


我 们 对 批 o_s 的 基本 实现 并 没有 把 运算 优先 级 考虑 进 来 ， 所 以 有 时 候 如 果 按 
照 传 统 的 优先 级 规则 (例如 * 通常 比 + 优先 级 更 高 ) 它们 的 输出 是 不 正确 
的 。 以 下 面 的 抽象 语法 树 为 例 : 
>> Multiply.new( 
Number.new(1)， 
Multiply.new( 


Add.new(Number.new(2), Number.new(3)), 
Number.new(4) 


) 
=> «1 * 2+3*4» 
这 棵 树 表示 “1* (2 + 3) * 4» 与 <1* 2 + 3* 4» 不 是 一 个 表达 式 (具有 不 
同 的 含义 ) ， 但 字符 串 表 示 并 没有 反映 出 这 一 点 。 
这 个 问题 很 严重 ， 但 与 我 们 关于 语义 的 讨论 完全 无 关 。 为 简单 起 见 ， 暂 时 先 
忽略 此 事 ， 避 开 可 能 拥有 不 正确 字符 串 描 述 的 表达 式 。 我 们 将 在 3.3.1 节 为 
另 一 种 语言 给 出 更 合适 的 实现 。 




















现在 为 抽象 语法 树 定义 规约 方法 ， 这 将 是 我 们 实现 一 个 小 步 操作 语义 的 起 点 。 也 就 是 说 ， 
代码 可 以 以 一 个 抽象 语法 树 作 为 输入 ， 然 后 生成 一 个 规约 树 作 为 输出 。 





在 实现 规约 本 身 之 前 ， 我 们 先 要 区 分 什么 样 的 表达 式 能 规约 ， 什 么 样 的 表达 式 不 能 规约 。 
Add 和 Multiply 表达 式 总 是 能 规约 的 【它们 的 每 一 个 表达 式 都 表示 一 个 操作 ， 并 能 够 通过 
那 种 操作 对 应 的 计算 变 成 一 个 结果 )， 但 是 Number 表达 式 总 是 代表 一 个 值 ， 它 就 不 能 规约 
成 任何 其 他 东西 了 。 

















原则 上 ， 我 们 可 以 使 用 简单 的 #reducible? 断言 把 这 两 种 表达 式 区 分 开 ， 它 能 判断 参数 是 
否 可 规约 ， 并 返回 true 或 者 false: 


def reducible?(expression) 
case expression 
when Number 
false 
when Add, Multiply 
true 


end 
end 





在 Ruby 的 case 语句 里 ， 控 制 表 达 式 与 case 值 是 否 匹 配 ， 是 通过 将 控制 表 
达 式 的 值 作为 参数 调用 每 个 case 值 的 #== 方 法 来 判断 的 。 方 法 析 == 的 实 
现 会 检查 它 的 参数 是 否 是 那个 类 或 者 那个 子 类 的 实例 ， 这 样 我 们 可 以 使 用 
“case 对 象 when 类 名 ”这 样 的 语法 为 一 个 类 匹配 一 个 对 象 。 








二 














但 是 ， 在 一 种 面向 对 象 语言 里 这 么 写 代 码 通常 被 认为 是 不 好 的 做 法 “， 如 果 一 些 运 算 的 行 
为 依赖 于 它 参 数 的 类 型 ， 典 型 的 做 法 是 将 这 种 每 个 类 都 有 的 行为 实现 为 它们 的 实例 方法 ， 
从 而 让 语言 隐 式 地 决定 调用 哪个 方法 ， 而 不 是 使 用 显 式 的 case 语句 。 





因此 ， 我 们 将 分 别 为 Number、Add 和 Multiply 实现 #reducible? 方法 : 


class Number 
def reducible? 
false 
end 
end 


class Add 
def reducible? 
true 
end 
end 


class Multiply 
def reducible? 


注 5: 尽管 我 们 用 Haskell 或 者 ML 这 样 的 函数 式 语 言 写 #feducible? 时 就 是 这 么 写 的 。 
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true 
end 
end 


这 回 的 表现 正 是 我 们 想 要 的 : 


>> Number.new(1).reducible? 

=> false 

>> Add.new(Number.new(1), Number.new(2)).reducible? 
=> true 





现在 可 以 为 这 些 表达 式 实现 规约 了 : 像 上 面 一 样 ， 我 们 为 Add 和 Multiply 定义 一 个 
#reduce 方法 。 既 然 数 字 不 能 再 规约 ， 那 就 没有 必要 定义 Number#reduce 了 ， 因 此 除非 确切 
知道 一 个 表达 式 能 够 规约 ， 否 则 不 要 对 其 调用 #reduce 方法 。 


那么 规约 加 法 表达 式 的 规则 是 什么 呢 ? 如 果 左 右 参 数 都 是 数字 ， 那 我 们 就 能 把 它们 加 到 一 
起 ,但 如 果 其 中 一 个 或 者 所 有 参数 需要 规约 怎么 办 ?既然 我 们 在 考虑 一 小 步 一 小 步 地 进行 
规约 ， 那 就 有 必要 在 它们 都 符合 规约 条 件 的 时 候 决 定 哪个 参数 先进 行规 约 "。 一 个 常用 的 
策略 是 按照 从 左 到 右 的 顺序 对 参数 进行 规约 ， 规 则 是 这 样 的 : 

。 如 果 加 法 左边 的 参数 能 够 规约 ， 就 规约 左边 的 参数 ， 


。 如 果 加 法 左边 的 参数 不 能 规约 ， 但 是 右边 的 参数 可 以 规约 ， 就 规约 右边 的 参数 ; 
。 如 果 两 边 都 不 能 规约 ， 它 们 应 该 都 是 数字 了 ， 就 把 它们 加 到 一 起 。 



































上 面 这 些 规 则 的 结构 是 小 步 规约 操作 语义 的 特征 。 每 一 个 规则 都 提供 了 它 能 得 以 应 用 的 表 
达 式 模式 (左边 参数 可 规约 的 加 法 ， 右 边 参 数 可 规约 的 加 法 ， 两 边 参 数 分 别 都 不 能 规约 的 
加 法 )， 还 有 对 当 模 式 匹配 上 之 后 如 何 构建 一 个 规约 后 的 新 表达 式 的 描述 。 选 择 了 这 些 特 
定 的 规则 之 后 ， 我 们 不 仅 确 定 了 那些 参数 分 别 规约 好 之 后 应 该 如 何 合并 到 一 起 ， 还 特别 指 
出 了 一 个 Simple 表达 式 要 使 用 从 左 到 右 求 值 的 方法 对 参数 进行 规约 。 











我 们 可 以 把 这 些 规则 直接 翻译 成 一 个 Add#reduce 的 实现 ， 同 样 的 代码 对 Multiply#reduce 
也 适用 ( 别 忘 了 要 把 参数 乘 起 来 而 不 是 加 起 来 ) : 


class Add 
def reduce 
if left.reducible? 
Add.new(left.reduce, right) 
elsif right.reducible? 
Add.new(left, right.reduce) 
else 
Number.new(left.value + right.value) 
end 
end 
end 











注 6: 选择 什么 顺序 并 没有 区 别 ， 但 是 在 这 个 时 候 我 们 必须 做 出 决策 。 

















class Multiply 
def reduce 
if left.reducible? 
Multiply.new(left.reduce, right) 
elsif right.reducible? 
Multiply.new(left, right.reduce) 
else 
Number.new(left.value * right.value) 
end 
end 


end 











方法 #feduce 总 是 构建 出 新 的 表达 式 ， 而 不 是 对 已 有 的 表达 式 进行 修改 。 











为 这 几 种 表达 式 实现 了 拉 educe 方法 之 后 ， 我 们 可 以 反复 对 其 进行 调用 ， 从 而 通过 很 多 的 
一 小 步 来 完整 地 求 出 表达 式 的 值 : 


>> expression = 
Add.new( 
Multiply.new(Number.new(1), Number.new(2)), 
Multiply.new(Number.new(3), Number.new(4)) 


=> «1 * 2+3*4» 
>> expression.reducible? 


=> true 

>> expression = expression.reduce 
=> «2 + 3 * 4» 

>> expression.reducible? 

=> true 

>> expression = expression.reduce 
=> «2 + 12» 

>> expression.reducible? 

=> true 

>> expression = expression.reduce 
=> 14» 

>> expression.reducible? 

=> false 


注意 ，#reduce 总 是 把 一 个 表达 式 转 换 成 另 一 个 表达 式 ， 这 正 是 小 步 规约 操 
。 作 语义 应 该 遵守 的 规则 。 特 别 要 注意 的 是 ，Add.new(Number.new(2), NumberT 
人 5，new(12)) .reduce 返回 的 Number.new(14) 表示 Simple 表达 式 ， 而 不 仅仅 是 14 
这 个 Ruby 中 的 数字 。 


Simple 语言 (我们 正在 为 其 定义 语义 ) 和 Ruby 元 语言 (我 们 正在 使 用 它 定 
义 语义 ) 在 明显 不 同 的 时 候 区 分 起 来 很 容易 一 一 就 像 元 语言 是 数学 符号 而 不 
是 一 种 程序 设计 语言 时 一 样 容 易 区 分 一 一 但 是 这 里 因为 两 种 语言 看 起 来 很 
像 ， 所 以 需要 更 加 小 心 。 







































































我 们 在 维护 着 一 个 状态 一 一 也 就 是 当前 表达 式 一 一 并 且 对 其 反复 调用 #reducible? 和 
#reduce， 直 到 得 到 了 一 个 值 为 止 ， 通 过 这 种 方式 ， 可 以 手工 模拟 一 个 抽象 机 器 对 表达 式 求 
值 的 操作 。 为 了 市 省 点 力气 ， 也 为 了 让 这 个 抽象 机 器 的 思想 更 为 具体 ， 我 们 可 以 轻松 地 写 
些 Ruby 代码 。 把 这 些 代码 和 状态 封装 到 一 个 类 里 ， 并 称 为 虚拟 机 : 


class Machine < Struct.new(:expression) 
def step 
self.expression = expression.reduce 
end 


def run 
while expression.reducible? 
puts expression 
step 
end 
puts expression 
end 
end 


这 允许 我 们 用 一 个 表达 式 实例 化 一 个 虚拟 机 ， 让 它 运 行 (#un)， 并 观察 逐渐 规约 的 各 个 步 
又 : 


>> Machine.new( 
Add.new( 
Multiply.new(Number.new(1), Number.new(2)), 
Multiply.new(Number.new(3), Number.new(4)) 











要 扩展 这 个 实现 以 支持 其 他 简单 的 值 和 运算 并 不 难 : 减法 和 除法 ， 布 尔 值 true 和 false， 


布尔 运算 and、or 和 not， 对 数字 进行 比较 并 返回 布尔 值 的 运算 ， 等 等 。 例 如 ， 下 画 
个 布尔 值 以 及 小 于 运算 的 实现 : 



































i 是 一 








class Boolean < Struct.new(:value) 
def to s 
value.to s 
end 


def inspect 
"«#{self}»" 
end 


def reducible? 
false 
end 
end 





Class LessThan < Struct.new(:left, :right) 
def to s 
"#{left} < #{right}" 
end 


def inspect 
"«#{self}»" 
end 


def reducible? 
true 
end 


def reduce 
if left.reducible? 
LessThan.new(left.reduce, right) 
elsif right.reducible? 
LessThan.new(left, right.reduce) 
else 
Boolean.new(left.value < right.value) 
end 
end 
end 


这 仍然 允许 我 们 一 小 步 一 小 步 地 规约 布尔 表达 式 : 


>> Machine.new( 


LessThan.new(Number.new(5), Add.new(Number.new(2), Number.new(2))) 


).run 
i 
5<4 
false 
=> nil 


目前 为 止 都 是 直截了当 的 东西 : 我们 通过 实现 能 对 一 种 语言 求 值 


的 虚拟 机 来 定义 它 的 操作 


语义 。 虚 拟 机 当前 的 状态 就 是 当前 的 表达 式 ， 而 机 器 的 行为 是 由 一 个 规则 集合 来 描述 的 ， 














这 个 规则 集合 负责 管理 机 器 运行 时 的 状态 切换 。 我 们 已 经 把 机 器 
跟踪 当前 表达 式 ， 持 续 对 其 进行 规约 ， 并 随 之 更 新 表达 式 ， 直 到 
继续 执行 为 止 。 


但 是 这 种 由 简单 代数 表达 式 组 成 的 语言 不 是 十 分 有 趣 ， 这 种 语言 
哪怕 是 最 简单 编程 语言 中 的 特性 。 接 下 来 我 们 把 它 构 建 得 更 复杂 
一 种 能 写 出 有 用 程序 的 语言 。 


首先 ，Simple 有 一 个 明显 缺失 的 东西 : 变量 。 在 任何 有 用 的 语言 




















实现 成 了 程序 ， 这 个 程序 
没有 更 进一步 的 规约 可 以 





没有 几 个 我 们 期 望 拥 有 的 
一 些 ， 让 它 看 起 来 更 像 是 


中 ， 我 们 都 期 望 在 讨论 值 


时 能 够 使 用 有 意义 的 名 字 而 不 是 它们 本 身 的 字面 值 。 这 些 名 字 提 供 了 一 个 间接 层 ， 这 样 同 

















一 个 代码 可 以 用 来 处 理 很 多 不 同 的 值 一 一 包括 来 自 于 程序 外 部 因 
道 的 值 。 














而 在 写 代码 时 甚至 都 不 知 





我 们 可 以 引入 一 个 新 的 表达 式 类 Variable 来 表示 Simple 中 的 变量 : 





class Variable < Struct.new(:name) 
def to s 
name.to s 
end 


def inspect 
"«#{self}»" 
end 


def reducible? 
true 
end 
end 


为 了 能 规约 一 个 变量 ， 抽 象 机 器 不 仅仅 需要 存储 当前 表达 式 ， 还 要 存储 从 变量 名 称 到 它 
们 值 的 映射 一 一 环境 (environment)。 在 Ruby 中 ， 我 们 可 以 把 这 个 映射 实现 成 一 个 散 列 
表 (hash) ， 其 中 用 符号 作为 键 ， 用 表达 式 对 象 作为 值 ， 例 如 ， 散 列表 {x:Number.new(2)， 
y:Boolean.new(false) } 是 一 个 环境 ， 它 分 别 把 变量 x 和 y 与 Simple 的 数字 和 布尔 值 进行 
了 关联 。 














¥ a 
对 这 种 语言 来 说 ,环境 的 目的 只 是 把 变量 名 映射 到 Number.new(2) 这 样 不 可 
re 规约 的 值 上 ， 而 不 是 映射 到 Add.new(Number.new(1)， Number.new(2)) 这 样 可 
发， 以 规约 的 表达 式 。 稍 后 我 们 编写 能 改变 环境 的 规则 时 要 注意 这 个 约束 。 





有 了 环境 ， 我 们 很 容易 实现 Variable#reduce: 它 只 是 在 环境 里 查找 变量 的 名 字 并 返回 其 值 。 


class Variable 
def reduce(environment) 
environment[name] 
end 
end 


注意 ， 我 们 正在 把 一 个 环境 作为 参数 传 进 #reduce， 所 以 需要 修改 其 他 类 的 #reduce 的 实 
现 ， 以 便 能 接受 和 提供 这 个 参数 : 


class Add 
def reduce(environment) 
if left.reducible? 
Add.new(left.reduce(environment), right) 
elsif right.reducible? 
Add.new(left, right.reduce(environment)) 
else 
Number.new(left.value + right.value) 
end 
end 
end 





class Multiply 
def reduce(environment) 
if left.reducible? 
Multiply.new(left.reduce(environment), right) 
elsif right.reducible? 
Multiply.new(left, right.reduce(environment)) 
else 
Number.new(left.value * right.value) 
end 
end 
end 


class LessThan 
def reduce(environment) 
if left.reducible? 
LessThan.new(left.reduce(environment), right) 
elsif right.reducible? 
LessThan.new(left, right.reduce(environment)) 
else 
Boolean.new(left.value < right.value) 
end 
end 
end 








现在 #reduce 的 所 有 实现 在 更 新 之 后 都 已 经 能 支持 环境 了 ， 因 此 还 需要 重新 定义 虚拟 机 ， 
以 便 维持 一 个 环境 并 把 它 提供 给 treduce; 


Object.send(:remove_const，:Machine) # 忘记 原来 的 Machine 类 


class Machine < Struct.new(:expression, :environment) 
def step 
self.expression = expression.reduce(environment) 
end 


def run 
while expression.reducible? 
puts expression 
step 
end 


puts expression 
end 
end 


机 器 对 #run 的 定义 仍然 没 变 ， 但 它 有 了 一 个 新 的 环境 属性 ， 这 个 属性 提供 给 #step 方法 新 
的 实现 使 用 。 











现在 只 要 我 们 也 提供 一 个 包含 变量 值 的 环境 ， 就 可 以 对 包含 变量 的 表达 式 进行 规约 了 : 














>> Machine.new( 
Add.new(Variable.new(:x), Variable.new(:y)), 


{ x: Number.new(3), y: Number.new(4) } 
) .run 





X 十 y 
3 +y 
3 
7 

=> nil 


环境 的 引入 完成 了 表达 式 的 操作 语义 。 我 们 已 经 设计 了 抽象 机 器 ， 它 由 一 个 初始 表达 式 和 
环境 开始 ， 然 后 在 每 次 规约 的 一 小 步 中 使 用 当前 的 表达 式 和 环境 生成 一 个 新 的 表达 式 ， 这 
个 过 程 中 环境 始终 没有 改变 。 





2. 语句 

现在 我 们 可 以 看 一 下 另 一 种 程序 结构 的 实现 : 语句 。 它 是 一 个 表达 式 ， 用 来 求 值 生成 另 
一 个 表达 式 ， 换 句 话 说， 一 个 语句 能 够 通过 求 值 改变 抽象 机 器 的 状态 。 机 器 唯一 的 状态 
(除了 当前 程序 ) 就 是 环境 ， 因 此 我 们 将 允许 Simple 的 语句 生成 一 个 新 的 环境 以 替换 当前 
环境 。 

















最 简单 的 语句 就 是 什么 都 不 做 的 语句 : 它 不 能 规约 ， 因 为 对 环境 没有 任何 影响 。 这 实现 起 
来 很 简单 ， 


class DoNothing © 
def to s 
‘do-nothing’' 
end 


def inspect 
"«#{self}»" 
end 


def ==(other statement) © 
other statement.instance of?(DoNothing) 
end 


def reducible? 
false 
end 
end 





其 他 所 有 语法 类 都 从 Struct 类 继承 ， 但 是 DoNothing 没有 继承 任何 类 。 这 是 因为 
DoNothing 什么 属性 都 没有 ， 而 且 遗 憾 的 是 ，Struct.new 还 不 让 我 们 传 一 个 空 的 属性 名 
称 列表 。 


名 想 要 比较 任意 两 个 语句 是 否 相 等 。 其 他 类 都 从 Struct 继承 了 #= 的 实现 ,但 DoNothing 
只 能 定义 它 自己 的 了 。 





Erg 











一 个 什么 都 不 做 的 语句 可 能 看 起 来 没什么 意义 ， 但 是 能 有 一 个 特殊 的 语句 表示 程序 已 经 执行 成 
功 会 非常 方便 。 其 他 语句 完成 了 它们 的 工作 之 后 ， 我 们 会 将 它们 最 终 规约 成 «do-nothing»。 








要 看 个 实用 语句 的 例子 ， 最 简单 的 就 是 像 cx = x + 1» 这 样 的 赋值 语句 ， 但 在 实现 赋值 话 
句 之 前 ， 我 们 还 需要 决定 它 的 规约 规则 。 


一 个 赋值 语句 由 一 个 变量 名 (Xx)、 一 个 等 号 和 一 个 表达 式 («x + 1») 组 成 。 如 果 赋 值 语句 
中 的 表达 式 是 可 规约 的 ， 我 们 就 可 以 按照 表达 式 规约 规则 对 其 进行 规约 并 最 终 得 到 一 个 包 
含 规约 后 表达 式 的 新 的 赋值 语句 。 例 如 ， 在 一 个 变量 x 值 为 «2» 的 环境 里 对 <x = x + 1» 进 
行规 约 ， 我 们 会 得 到 语句 «x = 2 + 1»， 然 后 再 把 它 规约 就 得 到 «x = 3»。 




















可 是 然后 呢 ? 如 有 果 表 达 式 已 经 是 “3，* 这 样 的 值 了 ， 那 么 我 们 就 应 该 执行 赋值 ， 也 就 意味 着 
对 环境 进行 更 新 ， 即 把 这 个 值 与 适当 的 变量 名 关联 起 来 。 因 此 规约 一 个 语句 不 单 需要 生成 
一 个 规约 了 的 新 语句 ， 还 要 产生 一 个 新 的 环境 ， 这 个 环境 有 时 候 会 与 执行 规约 时 的 环境 
不 同 。 























EE 
我 们 的 实现 将 使 用 Hashtimerge 创建 一 个 新 的 散 列 来 更 新 环境 ， 不 会 改变 
心 | 值 : 

[ISN 


>> old environment = { y: Number.new(5) } 

=> {:y=>«5»} 

>> new environment = old environment.merge({ x: Number.new(3) }) 
=> {:y=>«5», :X=>«3»} 

>> old_environment 

=> {:y=>«5»} 














可 以 选择 破坏 性 地 改变 当前 环境 ， 而 不 是 创建 一 个 新 的 ， 但 是 避免 破坏 性 的 
修改 可 以 促使 我 们 把 拉 educe 的 结果 完全 明确 出 来 。 如 果 #reduce 想 要 改变 
当前 的 环境 ， 它 就 得 给 调用 者 返回 一 个 改变 后 的 环境 进行 通知 ， 反之， 如果 
它 不 返回 一 个 环境 ， 那 么 就 可 以 上 表 定 没有 造成 任何 变化 。 





















































这 个 约束 帮助 我 们 强化 了 表达 式 和 语句 的 区 别 。 对 于 表达 式 ， 把 一 个 环境 传 
递 给 #reduce， 然 后 得 到 一 个 规约 了 的 表达 式 ， 因 为 没有 返回 一 个 新 的 环境 ， 
所 以 很 明显 规约 一 个 表达 式 不 会 改变 环境 。 对 于 语句 ， 我 们 将 用 当前 的 环境 
用 #reduce， 然 后 得 到 一 个 新 的 环境 ， 这 表明 规约 一 个 语句 会 对 环境 有 影 
站 。( 换 名 话说 ，Simple 小 步 语义 的 结构 告诉 我 们 : Simple 的 表达 式 是 纯净 
无 害 的 ， 而 它 的 语句 不 是 这 样 。) 
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因此 从 一 个 空 的 环境 规约 «x = 3» 应 该 会 产生 一 个 新 的 环境 { x: Number.new(3) }, 但 是 
我 们 还 期 望 这 个 语句 以 某 种 方式 得 到 规约 ， 不 然 的 话 ， 抽 象 机 器 将 会 不 断 地 把 «3» 赋值 给 
x。 这 时 候 «do-nothing» 就 派 上 用 场 了 : 一 个 完整 的 赋值 语句 规约 成 <do-nothing»， 就 表 
明 语 句 的 规约 已 经 结束 ， 并 且 可 以 认为 新 环境 中 的 东西 就 是 执行 结果 。 





总 结 起 来 ， 赋 值 的 规约 规则 是 : 





。 如 果 赋 值 表达 式 能 规约 ， 那 么 就 对 其 规约 ， 得 到 的 结果 就 是 一 个 规约 了 的 赋值 语句 和 一 


个 没有 改变 的 环境 ; 





。 如 果 赋 值 表达 式 不 能 规约 ， 那 么 就 更 新 环境 把 这 个 表达 式 与 赋值 的 变量 关联 起 来 ， 得 到 


的 结果 是 一 个 «do-nothing» 语句 和 一 个 新 的 环境 。 





这 样 ， 我 们 就 有 了 实现 一 个 赋值 类 Assign 的 足够 信息 。 唯 一 的 困难 





就 是 Assign#reduce 需 











要 既 返 回 一 个 语句 又 返回 一 个 环境 一 一 而 Ruby 的 方法 只 能 返回 一 个 对 象 一 一 但 我 们 可 以 











把 它们 放 到 由 两 个 元 素 组 成 的 数组 中 返回 ， 这 就 模拟 了 这 种 情况 。 


class Assign < Struct.new(:name, :expression) 
def to s 
"#{name} = #{expression}" 
end 


def inspect 
"«#{self}»" 
end 


def reducible? 
true 
end 


def reduce(environment) 
if expression.reducible? 


[Assign.new(name, expression.reduce(environment)), environment] 


else 
[DoNothing.new, environment.merge({ name => expression })] 
end 
end 


end 





(如 一 个 值 )， 它 就 只 会 增加 到 环境 上 。 


， 
3 








正如 我 们 承诺 的 那样 ，Assign 的 规约 规则 保证 了 如 果 一 个 表达 式 不 可 规约 


可 以 像 表 达 式 一 样 对 一 个 赋值 语句 反复 规约 ， 直 到 其 不 能 再 规约 为 止 。 通 过 这 个 方法 就 可 


以 对 一 个 赋值 表达 式 求 值 。 


> 
=> «X = X+ 1» 


YY 


>> environment = { x: Number.new(2) } 

=> {:x=>«2»} 

>> statement.reducible? 

=> true 

>> statement, environment = statement.reduce(environment) 


=> [«x = 2 + 1», {:x=>«2»}] 
>> statement, environment = 
=> [«x = 3， {:x=>«2»}] 

>> statement, environment = statement.reduce(environment) 
=> [«do-nothing», {:x=>«3»}] 


w 


statement.reduce(environment) 


statement = Assign.new(:x, Add.new(Variable.new(:x), Number.new(1))) 





>> statement.reducible? 
=> false 























这 个 过 程 甚至 比 手工 规约 表达 式 更 难 ， 因 此 为 了 处 理 语 句 ， 需 要 重新 实现 虚拟 机 ， 让 它 能 
在 每 一 步 规约 时 显示 当前 的 语句 和 环境 : 





Object.send(:remove const, :Machine) 


class Machine < Struct.new(:statement, :environment) 
def step 
self.statement, self.environment = statement.reduce(environment) 
end 


def run 
while statement.reducible? 
puts "#{statement}, #{environment}" 
step 
end 


puts "#{statement}, #{environment}" 
end 
end 


现在 这 人 台 机 器 又 可 以 为 我 们 工作 啦 : 


>> Machine.new( 
Assign.new(:x, Add.new(Variable.new(:x), Number.new(1))), 
{ x: Number.new(2) } 

).run 

x + 1, {:xX=>«2»} 

Xx = 2 + 1, {:x=>«2»} 

EX 

do-nothing, {:x=>«3»} 

=> Nil 


X 








可 以 看 到 ， 这 台 机 器 仍然 在 执行 表达 式 的 规约 步骤 (“x + 4» 规约 成 <2 + 12， 再 规约 成 
“32) ， 但 是 这 个 规约 过 程 现在 不 是 发 生 在 语法 树 的 顶层 ， 而 是 在 一 个 语句 里 。 






































既然 知道 语句 规约 是 如 何 工作 的 了 ， 那 么 我 们 就 可 以 对 其 进行 扩展 ， 以 支持 其 他 类 型 的 语 
句 。 让 我 们 从 «if (x) { y = 1 } else { y = 2 )» 这 样 的 语句 开始 ， 这 个 语句 包含 了 一 个 
叫 作 条 件 («x») 的 表达 式 ， 还 有 两 个 语句 ， 一 个 称 为 结果 («y = 1»)， 另 一 个 是 替代 话 向 
(«y = 2»)“。 对 条 件 进行 规约 的 规则 很 简单 ; 

















。 如 果 条 件 能 规约 ， 那 就 对 其 进行 规约 ， 得 到 的 结果 是 一 个 规约 了 的 条 件 语 句 和 一 个 没有 
改变 的 环境 ， 
。 如 果 条 件 是 表达 式 <true» 了 ， 就 规约 成 结果 语句 和 一 个 没有 变化 的 环境 ， 

















注 7: 此 条 件 语 句 与 Ruby 的 if 不同,Ruby 中 的 if 是 返回 一 个 值 的 表达 式 ,但 是 在 Simple 中 ,这 是 一 个 语句 ， 
它 从 其 他 两 个 语句 中 选择 一 个 求 值 ， 并 且 它 唯一 的 结果 就 是 对 当前 环境 的 影响 。 
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。 如 果 条 件 是 表达 式 <false»， 就 规约 成 替代 语句 和 一 个 没有 变化 的 环境 。 











一 个 新 的 表达 式 ， 而 不 会 产生 新 的 环境 。 
下 面 是 翻译 成 If 类 的 规则 : 


class If < Struct.new(:condition, :consequence, :alternative) 
def to s 
"if (#{condition}) { #{consequence} } else { #{alternative} }" 
end 


def inspect 
"«#{self}»" 
end 


def reducible? 
true 
end 


def reduce(environment) 
if condition.reducible? 
[If.new(condition.reduce(environment), consequence, alternative), environment] 
else 
case condition 
when Boolean.new(true) 
[consequence, environment] 
when Boolean.new(false) 
[alternative, environment | 
end 
end 
end 
end 





下 面 是 规约 操作 : 











>> Machine.new( 
If.new( 
Variable.new( :x), 
Assign.new(:y, Number.new(1)), 
Assign.new(:y, Number.new(2)) 
)， 
{ x: Boolean.new(true) } 
) .run 
if (x) {y=1}else{y= 2}, {:x=>«true»} 
if (true) {y= 1}else {y= 2}, {:x=>«true»} 
y = 1, {:x=>«true»} 
do-nothing, {:x=>«true», :y=>«1»} 
=> Nil 


在 这 种 情况 下 ， 所 有 规则 都 不 会 改变 环境 一 一 第 一 条 规则 中 对 条 件 表达 式 的 规约 只 会 生成 


这 些 都 与 预期 一 致 ， 但 如 果 能 文 持 不 带 «else» 从 名 的 条 件 语句 就 好 了 ， 比 如 “if (x) {y = 


1j2。 幸 和 运 的 是 ， 把 语句 写成 *if (x) { y = 1 } else { do-nothing 3 就 可 以 做 到 ， 这 和 





没有 «else» 从 名 的 效果 是 一 样 的 : 





>> Machine.new( 
If.new(Variable.new(:x), Assign.new(:y, Number.new(1)), DoNothing.new), 
{ x: Boolean.new(false) } 
) .run 
if (x) {y= 1} else { do-nothing }, {:x=>«false»} 
if (false) {y = 1 } else { do-nothing }, {:x=>«false»} 
do-nothing, {:x=>«false»} 
SnIL 


既然 不 仅 实现 了 表达 式 ， 还 实现 了 赋值 语句 和 条 件 语句 ， 我 们 就 有 了 组 成 程序 所 需要 的 基 
础 材料 ， 这 样 的 程序 可 以 执行 计算 和 进行 决策 ， 做 实际 的 工作 。 主 要 的 限制 是 我 们 还 不 能 
把 这 些 基础 材料 “连接 ”到 一 起 : 设 有 办 法 给 多 个 变量 赋值 或 者 执行 多 个 条 件 运算 ， 这 大 
幅度 地 限制 了 语言 的 可 用 性 。 











为 摆脱 这 个 限制 我 们 可 以 再 定义 一 种 语句 一 一 序列 (sequence)， 它 把 两 个 语句 (如 «x = 1 
+ 1» 和 <«y = x + 3») 连接 到 一 起 ， 组 成 一 个 更 大 的 语句 (如 «x = 1+1;y=X+3»)。 一 旦 
有 了 序列 语句 ， 我 们 就 可 以 反复 使 用 它们 构建 更 大 的 语句 ， 例 如， 序列 cx = 1+ 1 yY=X+ 
3 和 赋值 语句 “z = y + 5 能 连 到 一 起 组 成 序列 cx =1+1;y=xX+3;Zz=y+5»。 


对 序列 进行 规约 的 规则 有 点 微妙 : 


。 如 果 第 一 条 语句 是 «do-nothing»， 就 规约 成 第 二 条 语句 和 原始 的 环境 ， 
。 如 果 第 一 条 语句 不 是 «do-nothing»， 就 对 其 进行 规约 ， 得 到 的 结果 是 一 个 新 的 序列 ( 规 
约 之 后 的 第 一 条 语句 ， 后 边 跟着 第 二 条 语句 ) 和 一 个 规约 了 的 环境 。 


看 了 代码 你 会 更 清楚 这 些 规则 : 

















class Sequence < Struct.new(:first, :second) 
def to s 
"#{first}; #{second}" 
end 


def inspect 
"«#{self}»" 
end 


def reducible? 
true 
end 


def reduce(environment) 
case first 
when DoNothing.new 





注 8: 为 了 达到 我 们 的 目的 ， 这 个 语句 构造 成 <(x = 1+1;y=X+3);z=y+53 还 是 ex = 1+1; 
(y = X+3; z= y+5)» 都 没有 关系 。 在 执行 规约 时 ， 这 个 选择 会 影响 规约 的 顺序 ， 但 是 两 种 方式 最 
终 的 结果 是 一 样 的 。 
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[second, environment] 
else 
reduced first, reduced environment = first.reduce(environment) 
[Sequence.new(reduced first, second), reduced environment] 
end 
end 
end 

















这 些 规则 的 总 体 效果 就 是 : 不 断 规约 一 个 序列 时 ， 一 直 都 在 规约 它 的 第 一 个 语句 ， 直 到 成 
为 «do-nothing»， 然 后 再 去 规约 第 二 个 语句 。 在 虚拟 机 里 运行 一 个 序列 ， 我 们 可 以 看 到 这 
种 效果 : 
>> Machine.new( 
Sequence .new( 


Assign.new(:x, Add.new(Number.new(1), Number.new(1))), 
Assign.new(:y, Add.new(Variable.new(:x), Number.new(3))) 

















x=1+1;y=x+3,1{} 

i 35 {} 
do-nothing; y = x + 3, {:x=>«2»} 
y = xX + 3, {:x=>«2»} 

y 之 六 本 {:X=>«2»} 

y = 5, {:x=>?2?} 

do-nothing, {:x=>«2», :y=>«5»} 
=> nil 


Simple 里 重要 但 仍 缺 失 的 只 有 某 种 无 限制 的 循环 结构 了 ， 所 以 为 了 完成 任务 ， 我 们 引入 
一 个 euhile» 语句 ， 以 便 程序 可 以 执行 任意 次 数 的 重复 计算 ”。 像 ewhile(x < 5) {Xx = x 
* 3; 这 样 的 语句 ， 包 含 了 一 个 叫 作 条 件 (ex < 5») 的 表达 式 和 一 个 叫 作 语句 主体 (body) 
的 语句 (cx = x * 3»)。 


为 一 个 «while» 语句 写 出 正确 的 规约 规则 需要 一 点 技巧 。 我 们 尝试 着 像 “if， 语句 那样 对 
其 处 理 : 如果 能 规约 就 对 条 件 进行 规约 ， 不 能 的 话 ， 就 根据 条 件 是 true» 还 是 «false» 相 
应 地 规约 语句 主体 或 者 执行 “do-nothing”， 那 下 一 步 会 怎么 样 呢 ? 条 件 已 经 被 规约 成 一 个 
值 或 者 丢弃 了 ， 并 且 语 句 主 体 已 经 被 规约 成 <do-nothing»， 那 么 我 们 如 何 执 行 下 一 周期 的 
循环 呢 ? 每 一 步 规 约 要 想 与 将 来 的 规约 步 又 交流 ， 只 能 通过 产生 一 个 新 的 语句 和 环境 来 实 
现 ， 而 使 用 这 种 方法 ， 我 们 就 没有 地 方 记录 最 初 的 条 件 和 语句 主体 供 下 一 个 循环 使 用 。 


小 步 的 解决 方式 “是 使 用 序列 语句 把 while» 的 一 个 级 别 展开 ， 把 它 规约 成 一 个 只 执行 一 
次 循环 的 «if» 语句 ， 然 后 再 重复 原始 的 “while”。 这 意味 着 我 们 只 需要 一 个 规约 规则 : 







































































注 9: 使 用 序列 语句 ， 我 们 已 经 能 够 硬 编码 固定 数量 的 重复 操作 了 ， 但 还 是 无 法 控制 运行 时 的 重复 行为 。 
注 10: 我 们 总 试图 把 «while» 的 迭代 行为 直接 构建 成 规约 规则 ， 而 不 是 找到 一 种 途径 让 抽象 机 器 去 处 理 它 ， 
但 这 不 是 小 步 语义 的 工作 方式 。 参考 2.3.2 节 ， 其 中 介绍 的 大 步 语义 是 一 种 让 规则 完成 工作 的 语义 。 
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。 把 ewhile (条 件 ) { 语句 主体 }， 规约 成 cif (条件) { 语句 主体 ; while (条 件 ) 
{ 语句 主体 } } else { do-nothing }» 和 一 个 没有 改变 的 环境 。 


在 Ruby 中 实现 这 个 规则 很 容易 : 


class While < Struct.new(:condition, :body) 
def to s 
"while (#{condition}) { #{body} }" 
end 


def inspect 
"«#{self}»" 
end 


def reducible? 
true 
end 


def reduce(environment) 
[If.new(condition, Sequence.new(body, self), DoNothing.new), environment] 
end 
end 


这 给 了 虚拟 机 根据 需要 对 条 件 和 语句 主体 进行 求 值 的 机 会 : 


>> Machine.new( 
While. new( 
LessThan.new(Variable.new(:x), Number.new(5)), 
Assign.new(:x, Multiply.new(Variable.new(:x), Number.new(3))) 


{ x: Number.new(1) } 
) .run 
while (x < 5) { x = x * 3 }, {:x=>«1»} 
if (x< 5){x= x*3; while (x<5){x=x*3}}else { do-nothing }, {:x=>«1»} 
if (1< 5){x= x*3; while (x<5){x=x*3}}else { do-nothing }, {:x=>«1»} 
if (true) { x = x* 3; while (x < 5) {x=x*3}}else { do-nothing }, {:x=>«1»} 


x = XxX* 3; while (x < 5) {x = x * 3 }, {:x=>«1»} 
XL WhiLe (xX Cy {3 
x = 3; while (x < 5) { x = x * 3 }, {:x=>«1»} 

do-nothing; while (x < 5) X= xX* 3 }, {:x=>«3»} 


while (x < 5) { x = x * 3 }, {:x=>«3»} 

if (x< 5){x= x*3; while (x<5){x=x*3}}else { do-nothing }, {:x=>«3»} 
if (3 < 5){x= x*3; while (x< 5){x=x*3}}else { do-nothing }, {:x=>«3»} 
if (true) {x= x*3; while (x< 5) {x=x*3}}else { do-nothing }, {:x=>«3»} 


x = x*3; while (x < 5) { x= x* 3 }, {:x=>«3»} 
x=3*3; while (x < 5){ x= x* 3 }, {:x=>«3»} 
x = 9; while (x < 5) { x = x * 3 }, {:x=>«3»} 

do-nothing; while (x < 5) { xX = X* 3 }, {:x=>«9»} 


while (x < 5) { x = x * 3 }, {:x=>«9»} 
If (xX < 5) X= Whiler (x) xX 3 
if (9 < 5){ x= x*3; while (x<5){x=x*3} 
if (false) {x = x*3; while (x< 5) {x=x*3} 
do-nothing, {:x=>«9»} 

=> nil 


else { do-nothing }, {:x=>«9»} 
else { do-nothing }, {:x=>«9»} 
else { do-nothing }, {:x=>«9»} 


ET 





或 许 这 个 规约 规则 看 起 来 有 点 像 是 在 逃避 一 好 像 我 们 总 是 在 往 后 推迟 对 “while* 的 规约 ， 
一 直 没 有 实际 进展 一 一 但 它 确实 很 好 地 解释 了 一 个 «while» 语句 真正 的 意思 : 检查 条 件 ， 
对 语句 主体 求 值 ， 然 后 重新 开始 。 奇 怪 的 是 ， 对 «while» 进行 规约 ， 会 把 它 转换 成 一 个 语 
法 上 更 庞大 的 程序 ， 其 中 包括 条 件 语句 和 序列 语句 ， 而 不 是 直接 对 它 的 条 件 和 语句 主体 进 
行规 约 ， 但 有 一 个 能 定义 一 种 语言 形式 语义 的 技术 方案 是 非常 好 的 ， 因 为 我 们 会 更 易 理解 
这 种 语言 中 的 不 同 部 分 彼此 之 间 是 如 何 关联 的 。 


3. 正确 性 

如 果 程 序 只 是 语法 有 效 但 实际 上 是 错误 的 ， 这 时 按照 我 们 给 出 的 语义 执行 会 发 生 什么 呢 ? 
我 们 之 前 完全 忽视 了 这 一 点 。 语 句 «x = true; x = x + 1» 是 一 段 语法 有 效 的 Simple 代码 ， 
我 们 确实 可 以 构建 一 个 抽象 语法 树 来 表示 它 ， 但 试图 反复 对 其 规约 的 时 候 ， 它 将 会 崩溃 ， 
因为 在 尝试 往 <true» 上 加 “1* 的 时 候 抽象 机 器 会 终止 。 





























>> Machine.new( 
Sequence .new( 
Assign.new(:x, Boolean.new(true)), 
Assign.new(:x, Add.new(Variable.new(:x), Number.new(1))) 


) .Tun 
x= true; x=x+ 1, {} 
do-nothing; x = x + 1, {:x=>«true»} 
x = xX + 1, {:x=>«true»} 
x = true + 1, {:x=>«true»} 
NoMethodError: undefined method “+' for true:TrueClass 


处 理 这 个 问题 的 一 个 方法 就 是 在 表达 式 能 被 规约 的 时 候 增 加 更 多 的 约束 ， 加 入 对 求 值 失败 
可 能 性 的 考虑 ， 这 时 求 值 过 程 有 可 能 会 中 止 ， 而 不 是 总 要 试图 规约 成 一 个 值 (然后 就 可 能 
在 处 理 过 程 中 崩溃 )。 我 们 本 来 可 以 把 Add#reducible? 实现 成 这 样 ，«+» 的 两 个 参数 要 么 都 
是 可 规约 的 ， 要 么 都 是 数字 类 型 (Number) 实例 ， 这 时 它 才 返回 true， 这 种 情况 下 ， 表 达 
式 “true + 1» 将 会 中 止 处 理 而 永远 不 会 变 成 一 个 值 。 



































最 终 ， 我 们 需要 一 个 比 语法 更 强大 的 工具 ， 它 要 能 “看 到 未 来 ”并 让 我 们 避免 执行 任何 可 
能 崩溃 或 者 中 止 处 理 的 程序 。 这 一 章 是 关于 动态 语义 (dynamic semantic) 的 一 一 程序 执行 
时 具体 在 做 什么 一 一 但 那 并 不 是 一 个 程序 所 拥有 的 唯一 一 种 含义 ; 在 第 9 章 ， 我 们 将 研究 
静态 语义 (static semantic) ， 看 看 如 何 根据 语言 的 动态 语义 来 判断 一 个 语法 上 有 效 的 程序 
是 否 具 有 有 用 的 含义 。 


4. 应 用 

我 们 定义 的 程序 设计 语言 非常 基本 ， 但 在 写 下 所 有 规约 规则 的 时 候 ， 仍 然 不 得 不 做 了 一 些 
设计 上 的 决策 并 明确 地 表述 它们 。 例 如 ， 与 Ruby 不 同 的 是 ，Simple 这 种 语言 会 区 分 表达 
式 和 语句 ， 前 者 返回 一 个 值 ， 后 者 不 会 返回 值 ， 与 Ruby 相同 的 是 ，Simple 的 环境 只 与 已 












































经 完全 规约 成 值 的 变量 关联 ， 而 不 与 仍然 有 待 执行 的 更 大 表达 式 关 联 “。 我 们 可 以 通过 给 
出 不 同 的 小 步 语 义 来 改变 上 面 任 何 的 策略 ， 这 将 描述 一 种 新 的 语言 ， 这 种 语言 拥有 同样 的 
语法 ， 但 有 着 不 同 的 运行 时 行为 。 如 果 向 语言 中 增加 更 多 精心 设置 的 特性 一 一 数据 结构 、 
过 程 调用 、 异 常 和 一 个 对 和 象 系 统一 一 我 们 需要 做 出 更 多 的 设计 决策 并 在 定义 语义 时 无 歧义 
地 表达 它们 。 

小 步 语 义 的 细节 化 、 面 向 执行 的 风格 能 让 它 无 玻 义 地 定义 真实 世界 的 编程 语言 。 例 如 ， 
Scheme 编程 语言 最 新 的 R6RS 标准 使 用 了 小 步 语 义 (http://www.r6rs.org/final/html/r6rs/ 
r6rs-Z-H-15.html) 描述 其 执行 ， 并 提供 了 PLT Redex 语言 (http://redex.racket-lang.org/) 
(设计 用 来 定义 和 调试 操作 语义 的 一 门 特定 领域 的 语言 ) 对 那些 语义 的 参考 实现 (http:// 
www.r6rs.org/refimpl) 。OCaml 编程 语言 ， 在 一 个 更 简单 的 Core ML 语言 基础 之 上 构建 
了 一 系列 的 分 层 ， 也 有 对 于 基础 语言 运行 时 行为 的 小 步 语义 定义 (http://caml.inria.fr/pub/ 


docs/u3-ocaml/ocaml-ml.html#htoc5 ) 。 

















参考 6.2.2 市 ， 那 里 还 有 一 个 小 步 操作 语义 的 例子 ， 它 用 了 一 个 甚至 更 简单 的 叫 作 lambda 
演算 的 编程 语言 定义 了 表达 式 的 含义 。 


2.3.2 大 步 语义 

我 们 已 经 看 到 了 小 步 操作 语义 是 什么 样子 的 : 设计 一 台 抽 象 机 器 维护 一 些 执行 状态 ， 然 后 
定义 一 些 规约 规则 ， 这 些 规 则 详细 说 明了 如 何 才 能 对 每 种 程序 结构 循序 渐进 地 求 值 。 特 别 
地 ， 小 步 语义 大 部 分 都 带 有 迭代 的 味道 ， 它 要 求 抽象 机 器 反复 执行 规约 步骤 (Machine#run 
中 的 while 循环 ) ， 这 些 步 又 以 及 与 它们 同样 类 型 的 信息 可 以 作为 自身 的 输入 和 输出 ， 这 让 
它们 适合 这 种 反复 进行 的 应 用 程序 。” 


这 种 小 步 的 方法 有 一 个 优势 ， 就 是 能 把 执行 程序 的 复杂 过 程 分 成 更 小 的 片段 解释 和 分 析 ， 
但 它 确实 有 点 不 够 直接 : 我 们 没有 解释 整个 程序 结构 是 如 何 工 作 的 ， 而 只 是 展示 了 它 是 如 
何 慢 慢 规约 的 。 为 什么 不 能 更 直接 地 解释 一 个 语句 ， 完 整地 说 明 它 的 执行 过 程 呢 ?好 吧 ， 
我 们 可 以 ， 而 这 正 是 大 步 语 义 (big-step semantic) 的 依据 。 









































大 步 语义 的 思想 是 ， 定 义 如 何 从 一 个 表达 式 或 者 语句 直接 得 到 它 的 结果 。 这 必然 需要 把 程 
序 的 执行 当成 一 个 递归 的 而 不 是 迭代 的 过 程 : 大 步 语义 说 的 是 ， 为 了 对 一 个 更 大 的 表达 式 
求 值 ， 我 们 要 对 所 有 比 它 小 的 子 表达 式 求 值 ， 然 后 把 结果 结合 起 来 得 到 最 终 答案 。 


在 很 多 方面 ， 这 都 比 小 步 的 方法 更 自然 ， 但 确实 失去 了 一 些 对 细节 的 关注 。 例 如 ， 小 步 语 
义 明确 定义 了 操作 应 该 发 生 的 顺序 ， 因 为 在 每 一 步 都 明确 了 下 一 步 规 约 应 该 是 什么 。 但 是 























注 11: Ruby 的 proc 在 某 种 意义 上 允许 把 复合 表达 式 复制 给 变量 ， 但 是 一 个 proc 仍然 是 一 个 值 : 它 本 身 不 
能 再 执行 任何 求 值 操 作 了 ， 但 是 能 和 其 他 值 一 起 作为 一 个 更 大 表达 式 的 一 部 分 进行 规约 。 

注 12: 对 一 个 表达 式 和 一 个 环境 进行 规约 将 得 到 一 个 新 的 表达 式 ， 而 且 下 一 次 还 可 以 重用 旧 的 环境 ， 对 一 
个 语句 和 一 个 环境 进行 规约 将 得 到 一 个 新 的 语句 和 一 个 新 的 环境 。 
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大 步 语义 经 常会 写成 更 为 松散 的 形式 ， 只 会 说 哪些 子 计算 会 执行 ， 而 不 会 指明 它们 按 什么 
顺序 执行 。 ”小 步 语义 还 提供 一 种 轻松 的 方式 用 以 监视 计算 的 中 间 阶 段 ， 而 大 步 语义 只 是 
返回 回 一 个 结果 ， 不 会 产生 任何 关于 如 何 计算 的 证 据 。 


为 了 理解 做 出 的 这 种 权衡 ， 让 我 们 回顾 一 些 常见 的 语言 结构 ， 并 看 如 何在 Ruby 中 实现 它 
们 的 大 步 语义 。 我 们 的 小 步 语义 要 求 有 一 个 Machine 类 跟踪 状态 并 反复 执行 规约 ， 但 是 这 
里 不 需要 这 个 类 了 ; 大 步 规约 的 规则 描述 了 如 何 只 对 程序 的 抽象 语法 树 访问 一 次 就 计算 
出 整个 程序 的 结果 ， 因 此 不 需要 处 理 状 态 和 重复 。 我 们 将 只 对 表达 式 和 语句 类 定义 一 

#evaluate 方法 ， 然 后 直接 调用 它 。 


1. 表达 式 
处 理 小 步 语义 时 ， 我 们 不 得 不 区 分 像 *1 + 2» 这 样 可 规约 的 表达 式 和 像 “3» 这样 不 可 规约 
的 表达 式 ， 这 样 规约 规则 才能 识别 一 个 子 表达 式 什么 时 候 可 以 用 来 组 成 更 大 的 程序 。 但 是 
在 大 步 语义 中 ， 每 个 表达 式 都 能 求 值 。 唯 一 的 区 别 ， 如 果 我 们 想 要 有 个 区 别 的 话 ， 就 是 对 
一 些 表达 式 求 值 会 直接 得 到 它们 自身 ， 而 对 另 一 些 表达 式 求 值 会 执行 一 些 计算 并 得 到 一 个 
不 同 的 表达 式 ， 


大 步 语义 的 目标 是 像 小 步 语义 那样 对 一 些 运 行 时 行为 进行 建 模 ， 这 意味 着 我 们 期 望 对 于 每 
一 种 程序 结构 ， 大 步 语义 规则 都 要 与 小 步 语义 规则 程序 最 终生 成 的 东西 保持 一 致 。( 把 操 
作 语 义 写 成 数学 形式 之 后 ， 这 是 能 被 准确 证 明 的 。) 小 步 语义 规则 规定 ， 像 数值 (Number) 
和 布尔 值 《Boolean) 这 样 的 值 不 能 再 规约 了 ， 因 此 它们 的 大 步 规约 非常 简单 : 求 值 的 结果 
直接 就 是 它们 本 身 。 
































































































































class Number 
def evaluate(environment) 
self 
end 
end 


class Boolean 
def evaluate(environment) 
self 
end 
end 





变量 (Variable) 表达 式 是 唯一 的 ， 这 样 它们 的 小 步 语 义 允许 它们 在 成 为 一 个 值 之 前 只 规约 
一 次 ， 所 以 它们 的 大 步 语 义 规 则 与 小 步 规则 一 样 : 在 环境 中 查找 变量 名 然后 返回 它 的 值 。 





class Variable 
def evaluate(environment) 
environment[name] 








注 13: 我 们 用 这 种 方法 实现 的 大 步 语义 不 会 有 二 义 性 ， 因 为 Ruby 本 身 已 经 进行 了 排序 决策 ， 但 是 在 数学 
化 地 定义 大 步 语 义 时 ， 就 不 可 避免 地 要 讲 清 楚 准确 的 求 值 策略 了 。 
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end 
end 





二 元 表达 式 Add、Mujltiply 和 LessThan 更 有 意思 ， 它 们 要 求 先 对 左右 子 表达 式 递 归 求 值 ， 
然后 再 用 恰当 的 Ruby 运算 合并 两 边 的 结果 值 : 


class Add 
def evaluate(environment ) 
Number.new(left.evaluate(environment).value + right.evaluate(environment).value) 
end 
end 





























class Multiply 
def evaluate(environment) 
Number.new(left.evaluate(environment).value * right.evaluate(environment).value) 
end 
end 


class LessThan 
def evaluate(environment) 
Boolean.new(left.evaluate(environment).value < right.evaluate(environment).value) 
end 
end 





为 了 检查 这 些 大 步 的 表达 式 语 义 是 否 正确 ， 下 面 将 在 Ruby 的 控制 台 验 证 一 下 : 


>> Number.new(23).evaluate({}) 
= 23 
>> Variable.new(:x).evaluate({ x: Number.new(23) }) 
二 过 
>> LessThan.new( 

Add.new(Variable.new(:x), Number.new(2)), 

Variable.new(:y) 

).evaluate({ x: Number.new(2), y: Number.new(5) }) 

=> «true» 











2. 语句 

在 我 们 要 定义 语句 的 行为 时 ， 这 种 类 型 的 语义 就 能 发 挥 作用 了 。 在 小 步 语义 下 表达 式 会 规 
约 成 其 他 表达 式 ， 但 语句 会 规约 成 <do-nothing» 并 且 得 到 一 个 经 过 修改 的 环境 。 我 们 可 以 
把 大 步 语义 的 语句 求 值 看 成 一 个 过 程 ， 这 个 过 程 总 是 把 一 个 语句 和 一 个 初始 环境 转 成 一 个 
最 终 的 环境 ， 这 避免 了 小 步 语义 不 得 不 对 #educe 产生 的 中 间 语 名 进行 处 理 的 复杂 性 。 例 
如 ， 对 一 个 赋值 语句 按照 大 步 的 方法 求 值 应 该 完整 地 对 其 表达 式 求 值 ， 并 返回 一 个 包含 结 
果 值 的 更 新 了 的 环境 : 
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class Assign 
def evaluate(environment) 
environment.merge({ name => expression.evaluate(environment) }) 
end 
end 


类 似 地 ，DoNothing#evaluate 无 疑 将 把 未 更 改 的 环境 返回 ， 而 If#evaluate 的 工作 相当 地 直 
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接 : 对 条 件 求 值 ， 然 后 把 环境 返回 ， 这 个 环境 来 自 于 对 序列 或 者 替代 语句 求 值得 到 的 结果 。 


class DoNothing 
def evaluate(environment) 
environment 
end 
end 


class If 
def evaluate(environment) 
case condition.evaluate(environment) 
when Boolean.new(true) 
consequence.evaluate(environment) 
when Boolean.new(false) 
alternative.evaluate(environment) 
end 
end 
end 


有 两 种 有 趣 的 情况 就 是 序 Se 对 于 序列 ， 我 们 只 需要 对 两 个 语 
句 求 值 ， 但 是 初始 环境 需要 “ 这 两 个 求 值 过 程 ， 这 样 第 一 个 语句 求 值 的 结果 就 能 成 
为 第 二 个 语句 求 值 的 环境 。3 ee 用 第 一 次 求 值 的 结果 作为 第 二 次 求 值 
的 参数 : 
































class Sequence 
def evaluate(environment) 
second.evaluate(first.evaluate(environment)) 
end 
end 


为 了 让 先前 的 语句 为 后 边 的 做 准备 ,，“ 穿 过 ”环境 是 至 关 重 要 的 : 








>> statement = 
Sequence .new( 
Assign.new(:x, Add.new(Number.new(1), Number.new(1))), 
Assign.new(:y, Add.new(Variable.new(:x), Number.new(3))) 


=> «X=1+1;Yy= XxX+3» 
>> statement.evaluate({}) 
> { :X=>«2», :y=>«5»} 


对 于 whiley 语句 ， 我 们 需要 彻底 想 清楚 对 一 个 循环 完整 求 值 的 各 个 阶段 : 
。 对 条 件 求 值 ， 得 到 «true» 或 者 <false»， 
。 如 果 条 件 求 值 结果 是 ctrue»， 就 对 语句 主体 求 值得 到 一 个 新 的 环境 ， 然 后 在 那个 新 的 


环境 下 重复 循环 (也 就 是 说 对 整个 «while» 语句 再 次 求 值 )， 最 后 返回 作为 结果 的 环境 ; 
。 如 果 条 件 求 值 结 果 是 “false*， 就 返回 未 修改 的 环境 。 



























































这 是 对 一 个 “while* 语句 行为 的 递归 解释 。 就 像 序列 语句 ， 循 环 体 生成 的 更 新 了 的 环境 被 





下 一 个 迭代 使 用 这 一 点 非常 重要 ;， 不然 的 话 ， 条 件 一 直 都 是 “true”， 那 么 循环 就 永远 也 没 
有 机 会 停 下 来 了 。” 


知道 了 大 步 «while» 语义 的 行为 表现 之 后 ， 就 可 以 实现 While#evaluate 了 : 


class While 
def evaluate(environment) 
case condition.evaluate(environment) 
when Boolean.new(true) 
evaluate(body.evaluate(environment)) © 
when Boolean.new(false) 
environment 
end 
end 
end 





@ 循环 在 这 里 发 生 : body.evaluate(environment) 对 循环 求 值得 到 一 个 新 的 环境 ， 然 


后 我 们 把 那个 环境 传 回 当 前 方法 中 开始 下 一 次 迭代 。 这 意味 着 可 能 会 堆积 很 多 对 
While#evaluate 的 风 套 调用 ， 直 到 条 件 最 后 成 为 <false» 然后 返回 最 后 的 环境 。 

















就 像 任何 递归 代码 一 样 ， 如 果 调 用 内 套 得 太 深 可 能 会 导致 Ruby 调用 本 溢出 。 
一 人 一 些 Ruby 的 实现 会 实验 性 地 支持 对 尾 调用 的 优化 ， 这 个 技术 能 通过 尽 可 能 
重用 同样 的 栈 帧 来 减少 溢出 风险 。 在 Ruby 的 官方 实现 (MRI) 里 ， 我 们 可 
以 这 样 打开 尾 调用 优化 : 


























RubyVM: :InstructionSequence.compile option = { 
tailcall optimization: true, 
trace instruction: false 


} 





为 了 确认 生效 ， 可 以 尝试 对 同样 的 «while» 语句 求 值 ， 这 是 之 前 用 来 检查 小 步 语义 的 : 





>> statement = 
While.new( 
LessThan.new(Variable.new(:x), Number.new(5)), 
Assign.new(:x, Multiply.new(Variable.new(:x), Number.new(3))) 


=> «while (x < 5) {x=x*3}» 


>> statement.evaluate({ x: Number.new(1) }) 
=> {:x=>«9»} 


这 与 小 步 语义 给 出 的 结果 一 致 ， 所 以 看 起 来 hile#evaluate 做 的 事情 疫 错 。 


3. 应 用 
我 们 稍 早 时 候 对 小 步 语 义 的 实现 只 是 适度 使 用 了 Ruby 调用 栈 : 在 对 一 个 大 型 程序 调用 











注 14: 当然 ， 没 有 什么 能 够 阻止 Simple 程序 员 写 出 条 件 永远 也 不 会 为 《false》 的 《while》 语 句 ， 但 如 果 
那 就 是 他 们 想 要 的 ， 那 也 是 可 行 的 。 
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#reduce 时 ， 消 息 会 志 历 抽象 树 直 到 其 到 达 一 段 准 备 好 规约 的 代码 ， 这 会 引起 一 系列 对 
#reduce 的 嵌 套 调用 。” 但 是 伴随 着 反复 执行 小 步 规 约 ， 虚 拟 机 通过 维护 当前 程序 和 环境 完 
成 了 对 整个 计算 过 程 的 跟踪 ， 值 得 一 提 的 是 ， 和 藤 套 调 用 只 是 用 来 志 历 语法 树 查找 下 一 步 的 
规约 对 象 ， 而 不 是 执行 规约 本 身 ， 因 此 调用 栈 的 深度 受到 程序 语法 树 深 度 的 限制 。 


相 比 之 下 ， 大 步 方式 的 实现 会 执行 较 小 规模 的 计算 ， 并 将 其 作为 更 大 规模 计算 的 一 部 分 。 
为 了 跟踪 还 有 多 少 求 值 工作 要 做 ， 它 使 用 了 更 多 的 栈 ， 并 完全 依赖 栈 来 记 住 当前 处 理 在 整 
个 计算 中 的 位 置 。 看 上 去 像 是 对 #evaluate 的 一 次 调用 ， 实 际 上 转换 成 了 一 系列 递归 调用 ， 
每 一 次 调用 都 对 一 个 子 程序 求 值 ， 这 都 让 其 在 语法 树 中 更 进一步 。 



























































这 个 差别 突出 了 每 一 种 方法 的 目的 。 小 步 语义 设 定 了 一 台 能 执行 小 操作 的 简单 抽象 机 器 ， 
因此 它 包 含 了 关于 如 何 产生 有 用 中 间 结 果 的 详尽 细节 ， 大 步 语义 把 汇编 整个 计算 的 重担 交 
给 了 机 器 或 者 执行 它 的 人 ， 在 仅 通过 一 步 操作 就 把 整个 程序 转换 成 一 个 最 终结 果 的 过 程 
中 ， 要 求 它 跟踪 许多 中 间 子 目标 。 根 据 我 们 想 用 一 个 语言 的 操作 语义 干什么 一 一 或 是 构建 
一 个 高 效 的 实现 ， 证 明 程 序 的 某 些 属性 ， 或 是 设计 某 个 最 佳 变 换 一 一 可 能 采用 其 中 一 种 方 
法 或 者 另 一 种 方法 会 更 合适 。 















































大 步 语 义 在 定义 真正 程序 设计 语言 上 最 有 影响 的 应 用 是 第 6 章 提 到 的 标准 ML 编程 语言 
(http://www.lfcs.inf.ed.ac.uk/reports/87/ECS-LFCS-87-36/) 的 原始 定义 ， 它 用 大 步 方式 定义 
了 ML 的 所 有 运行 时 行为 。 在 这 个 例子 之 后 ，OCam 的 核心 语言 用 大 步 语义 (http://caml. 
inria.fr/pub/docs/u3-ocaml/ocaml-ml.html#htoc7) 补足 了 它 更 细节 的 小 步 定 义 。 











W3C 也 用 到 了 大 步 操作 语义 : XQuery 1.0 和 XPath 2.0 规范 (http://www.w3.org/TR/xquery- 
semantics/) 使 用 数学 化 的 推理 规则 描述 它 的 语言 应 该 如 何 求 值 ， 并 且 XQuery 和 XPath 规 
范 全 文 的 3.0 版 本 (http:Wwww.w3.org/TR/xpath-full-text-30/) 包括 了 一 个 使 用 XQuery 写成 
的 大 步 语 义 。 








你 可 能 注意 到 了 ， 通 过 使 用 Ruby 语言 而 不 是 数学 语言 写 下 Simple 的 小 步 和 大 步 语义 ， 我 
们 已 经 为 它 实现 了 两 个 不 同 的 Ruby 解释 器 。 操 作 语义 实质 上 是 这 样 的 : 通过 描述 一 个 解 
析 器 来 说 明 一 种 语言 的 含义 。 正 常情 况 下 ， 这 个 摘 述 应 该 用 简单 的 数学 符号 来 写 ， 只 要 我 
们 能 理解 ， 这 将 使 一 切 都 清晰 而 且 无 上 收 义 ， 但 是 这 样 过 于 抽象 而 且 离 现实 中 的 计算 机 有 一 
定 距离 。 把 一 种 真实 世界 编程 语言 的 额外 复杂 性 (类 、 对 象 、 方 法 调用 ……) 引入 到 本 该 
简约 的 说 明 当 中 ， 这 是 Ruby 语言 的 缺点 ， 但 是 如 果 我 们 已 经 理解 Ruby， 那 么 就 更 容易 理 
解 整个 过 程 ， 并 且 能 够 执行 的 描述 可 以 当 作 一 个 解释 器 ， 这 是 个 很 好 的 红利 。 
































注 15: 有 一 种 操作 语义 的 替换 形式 ， 叫 作 规约 语义 ， 它 通过 引入 所 谓 的 规约 上 下 文 ， 把 “下 一 步 规约 什么 ” 

和 “如 何 对 其 进行 规约 ”分 离开 来 。 这 些 上 下 文 只 是 一 些 简明 描述 了 规约 在 程序 中 何 处 发 生 的 模式 。 
这 意味 着 我 们 只 需要 写真 正 执行 计算 的 规约 规则 ， 从 而 把 一 些 样板 文件 (boilerplate) 从 更 大 型 的 语 
言 中 去 掉 。 


























2.4 指称 语义 


到 目前 为 止 ， 我 们 已 经 从 操作 性 方面 观察 了 程序 设计 语言 的 含义 ， 它 通过 展示 程序 执行 之 
后 发 生 的 事情 解释 了 程序 的 含义 。 而 指称 语义 (denotational semantic) 转 而 关心 从 程序 本 
来 的 语言 到 其 他 表示 的 转换 。 


这 种 类 型 的 语义 没有 直接 处 理 程序 的 执行 ， 而 是 关注 如 何 借 助 另 一 种 语言 的 已 有 含义 
一 种 低级 的 、 更 形式 化 的 或 者 至 少 比 正在 描述 的 语言 更 好 理解 的 语言 一 一 解释 一 个 新 的 


语言 。 


指称 语义 确实 是 一 种 比 操作 语义 更 抽象 的 方法 ， 因 为 它 只 是 用 一 种 语言 奉 换 另 一 种 语 
言 ， 而 不 是 把 一 种 语言 转换 成 真实 的 行为 。 例 如 ， 如 果 我 们 需要 向 一 个 人 解释 英语 动词 
“walk” 的 含义 ， 但 和 他 没有 共同 的 口头 语言 ， 可 以 通过 来 回 走 的 动作 来 沟通 。 另 一 方面 ， 
如 果 我 们 需要 向 一 个 说 法 语 的 人 解释 “walk”， 可 以 跟 他 讲 “marcher” 不 可 否认 这 是 
一 种 更 高 层次 的 沟通 方式 ， 不 需要 麻烦 地 运动 了 。 


















































指称 语义 通常 用 来 把 程序 转 成 数学 化 的 对 象 ， 所 以 不 出 意料 ， 可 以 用 数学 工具 研究 和 控制 
它们 ,但 是 我 们 可 以 看 看 如 何 用 另 一 种 方式 表示 Simple 程序 ， 借 此 大 致 了 解 指称 语义 。 





把 Simple 转 成 Ruby 从 而 得 到 Simple 语言 的 指称 语义 , “事实 上 ， 这 意味 着 把 一 个 抽象 语 
法 树 转 成 一 个 Ruby 代码 的 字符 串 。 不 管 怎样 ， 我 们 得 到 了 那 种 语法 本 来 的 含义 。 





但 “本 来 的 含义 ”是 什么 呢 ? 我 们 表达 式 和 话 句 的 Ruby 指称 (denotation) 是 什么 样 的 
呢 ? 从 操作 上 我 们 已 经 看 到 一 个 表达 式 使 用 一 个 环境 (environment) 然后 把 它 转 成 一 个 
值 ， 在 Ruby 中 表达 这 个 过 程 的 一 种 方式 是 用 一 些 参数 表示 环境 参数 ， 然 后 返回 一 些 表示 
值 的 Ruby 对 象 。 对 于 像 «5» 和 «false» 这 样 简单 的 常量 表达 式 ， 我 们 根本 无 需 使 用 环境 ， 
而 只 需要 关心 它们 最 终 的 结果 如 何 能 表示 成 一 个 Ruby 对 象 。 幸 运 的 是 ，Ruby 已 经 设计 了 
专门 的 对 象 表示 这 些 值 : 我 们 可 以 使 用 Ruby 值 5 作为 Simple 表达 式 «5» 的 结果 ， 同 样 地 ， 
把 Ruby 的 值 false 作为 “falsey 的 结果 。 


2.4.1 表达 式 


我 们 可 以 用 这 个 思想 为 Number 类 和 Boolean 类 写 一 个 批 o_ruby 的 实现 : 









































class Number 


def to ruby 
"-> e { #{value.inspect} }" 
end 
end 














注 16: 这 意味 着 我 们 将 用 Ruby 代码 生成 Ruby 代码 ， 但 是 选择 用 同样 的 指称 语言 和 实现 元 语言 只 是 为 了 让 
事情 简单 。 例 如 我 们 很 容易 用 Ruby 写 出 能 生成 包含 JavaScript 字符 串 的 代码 来 。 
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class Boolean 


def to_Tuby 
"-> e { #{value.inspect} }" 
end 
end 


下 面 在 控制 台 运 行 它们 : 


>> Number.new(5).to ruby 

-> "ef{fsy 

>> Boolean.new(false).to_ruby 
=> "-> e { false }" 

















这 些 方 法 每 个 都 产生 一 个 刚好 包含 Ruby 代码 的 字符 串 ， 并 且 因 为 Ruby 是 一 种 我 们 已 经 理 
解 其 含义 的 语言 ， 所 以 可 以 看 到 这 些 字符 串 都 是 构造 proc 的 程序 。 每 一 个 proc 都 带 有 一 
个 叫 e 的 环境 参数 ， 它 们 完全 忽略 这 个 参数 而 直接 返回 一 个 Ruby 值 。 








T 














因为 这 些 符号 都 是 Ruby 代码 组 成 的 字符 串 ， 所 以 可 以 使 用 Kernel#eval 转换 成 可 调用 的 
Proc 对 象 实际 执行 ， 然 后 在 IRB 中 检查 它们 的 行为 ”: 


>> proc = eval(Number.new(5).to_ ruby) 

=> #<Proc (lambda)> 

>> proc.call({}) 

= 二 

>> proc = eval(Boolean.new(false).to_ruby) 
=> #<Proc (lambda)> 

>> proc.call({}) 

=> false 





现 阶段 ， 完 全 避免 proc， 而 使 用 更 简单 的 #to_ruby 实现 是 很 诱 人 的 ， 这 只 
一 人》 需要 把 Nunber.new(5) 转换 成 字符 串 '5' 而 不 是 ，-》 e {5}' 等 ， 但 是 从 源 语 
言 结构 中 获得 其 本 质 语义 是 指称 语义 这 一 方法 的 一 部 分 ， 那 么 我 们 需要 知 
道 ， 即 便 某 些 特定 的 表达 式 不 会 用 到 环境 ， 通 常 的 表达 式 也 还 是 需要 一 个 环 
境 的 。 

















为 了 表示 确实 使 用 环境 的 表达 式 ， 我 们 需要 决定 如 何 用 Ruby 表示 环境 (environment)。 在 研 
究 操 作 语 义 时 我 们 已 经 了 解 了 环境 ， 那 么 既然 它们 已 经 用 Ruby 实现 了 ， 现 在 可 以 重用 早期 
的 思想 一 一 把 一 个 环境 表示 成 一 个 散 列表 。 不 过 细节 需要 做 一 些 改动 ， 因 此 要 注意 其 中 微妙 
的 差别 : 在 我 们 的 操作 语义 中 ， 环 境 是 生存 在 虚拟 机 中 的 ， 并 且 把 变量 名 与 Number.new(5) 
这 样 的 Simple 抽象 语法 树 联 系 起 来 ， 但 在 我 们 的 指称 语义 中 ， 环 境 存在 于 我 们 要 把 
程序 转换 得 到 的 语言 中 ， 因 此 要 在 那个 世界 而 不 是 在 一 个 虚拟 机 的 “外 部 世界 ”起 
作用 。 

















注 17: 只 有 Ruby 既 做 实现 语言 又 作为 指称 语言 的 时 候 我 们 才能 这 么 做 。 如 果 指 称 是 JavaScript 源 代 码 ， 我 
们 就 得 到 JavaScript 的 控制 台 去 实验 它们 了 。 





注意 ， 这 意味 着 指称 环境 (denotational environment) 应 该 把 变量 名 与 5 这 样 的 原生 Ruby 
值 ， 而 不 是 与 表示 Simple 语法 的 对 象 关联 起 来 。 我 们 把 { x: Number.new(5) } 这 样 的 操作 环 
境 (operational environment) 看 成 在 要 转换 成 的 语言 中 拥有 指称 '{ x: 5 }'， 并且 因 为 实现 
的 元 语言 和 指称 语言 正好 都 是 Ruby， 所 以 不 必 有 什么 顾忌 。 

















既然 知道 环境 将 是 一 个 散 列 ， 那 么 就 可 以 实现 Variable#to_ruby 了 : 


class Variable 


def to ruby 
"-> e { el#{name.inspect}] }" 
end 
end 


这 段 代 码 ， 把 一 个 变量 表达 式 转 换 成 一 个 在 环境 散 列 中 查找 合适 值 的 Ruby proc: 


>> expression = Variable.new(:X) 
=> «X» 

>> expression.to ruby 

=> "->e { ef:x] }" 

>> proc = eval(expression.to ruby) 
=> #<Proc (lambda)> 

>> proc.call({ x: 7 }) 

= 


关于 指称 语义 重要 的 一 点 是 它 是 组 合式 的 : 一 个 程序 的 指称 由 组 成 它 的 各 部 分 的 指示 构 
成 。 在 开始 指称 (denotating) Add、Multiply 和 LessThan 这 样 的 更 大 表达 式 时 ， 我 们 就 能 
里 解 这 种 合成 性 了 : 

















YH 





class Add 
def to ruby 
"-> e { (#{left.to ruby}).call(e) + (#{right.to ruby}).call(e) }" 
end 
end 


class Multiply 


def to ruby 
"-> e { (#{left.to ruby}).call(e) * (#{right.to ruby}).call(e) }" 
end 
end 


class LessThan 


def to ruby 
"-> e { (#{left.to ruby}).call(e) < (#{right.to ruby}).call(e) }" 
end 
end 


这 里 使 用 字符 串 串 联 操作 把 子 表达 式 的 指称 组 成 一 个 大 表达 式 的 指称 。 我 们 知道 每 一 个 子 
表达 式 都 将 在 Ruby 源码 中 用 一 个 proc 表示 ， 因 此 可 以 将 它们 作为 更 大 段 Ruby 代码 的 一 
部 分 ， 那 些 更 大 段 的 代码 使 用 提供 的 环境 调用 这 些 proc， 并 使 用 它们 返回 的 值 进行 一 些 计 
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算 。 下 面 是 得 到 结果 : 


要 











>> Add.new(Variable.new(:x), Number.new(1)).to ruby 

=> "->e{(->e {el:x] }).call(e) + (->e { 1}).call(e) }" 

>> LessThan.new(Add.new(Variable.new(:x), Number.new(1)), Number.new(3)).to ruby 

= > "->e{(->e{(->e {el:x] }).call(e) + (-> e { 1 }).call(e) }).call(e) < (->ef{ 
3 }).call(e) }" 


这 些 指称 已 经 够 复杂 的 了 ， 很 难 了 解 它们 做 的 事情 是 否 正确 。 让 我 们 运行 它们 确认 一 下 : 


>> environment ={ x: 3 } 
=> {:x=>3} 
>> proc = eval(Add.new(Variable.new(:x), Number.new(1)).to ruby) 
=> #<Proc (lambda)> 
>> proc.call(environment) 
=> 4 
>> proc = eval( 
LessThan.new(Add.new(Variable.new(:x), Number.new(1)), Number.new(3)).to ruby 


=> #<Proc (lambda)> 
>> proc.call(environment) 
=> false 


2.4.2 语句 

我 们 可 以 用 类 似 的 方式 定义 语句 的 指称 语义 ， 但 是 要 记 住 操作 语义 中 提 到 的 ， 对 一 个 语句 
求 值 产生 的 是 一 个 新 的 环境 而 不 是 一 个 值 。 这 意味 着 Assign#to_ruby 需要 为 proc 构造 一 
些 代 码 ， 以 使 结果 是 一 个 更 新 了 的 环境 散 列 : 





























class Assign 


def to ruby 
"-> e { e.merge({ #{name.inspect} => (#{expression.to ruby}).call(e) }) }" 
end 
end 


还 是 可 以 在 控制 台 对 其 进行 检查 : 


>> statement = Assign.new(:y, Add.new(Variable.new(:x), Number.new(1))) 

=> «y = X+ 1» 

>> statement.to ruby 

=> "-> e { e.merge({ :y => (->e{ (->e {el:x] }).call(e) + (->e { 1}).call(e) }) 
.call(e) }) }" 

>> proc = eval(statement.to ruby) 

=> #<Proc (lambda)> 

>> proc.call({ x: 3 }) 

=> {:X=>3, :y=>4} 





和 之 前 一 样 ，DoNothing 的 语义 非常 简单 





class DoNothing 
def to ruby 





'->e{ey' 
end 
end 


对 于 条 件 语句 ， 我 们 可 以 把 Simple 的 «if (...) { ... } else { ... ]» 转换 成 一 个 Ruby 
的 if ... then ... else ... end， 确保 环 境 传 到 了 需要 它 的 地 方 : 


class If 
def to ruby 
"-> e { if (#{condition.to ruby}).call(e)" + 
" then (#{consequence.to ruby}).call(e)" + 
" else (#{alternative.to ruby}).call(e)" + 
" end }" 
end 
end 





就 像 在 大 步 操作 语义 中 一 样 ， 我 们 需要 小 心地 定义 序列 语句 : 对 第 一 个 语句 求 值 的 结果 作 
为 对 第 二 个 语句 求 值 时 的 环境 。 














class Sequence 


def to ruby 
"-> e { (#{second.to ruby}).call((#{first.to ruby}).call(e)) }" 
end 
end 














最 后 ， 就 像 处 理 条 件 语 句 那 样 ， 我 们 可 以 把 «while» 语句 转 成 proc， 在 返回 最 终 环境 之 前 ， 
它 使 用 Ruby 的 while 重复 执行 语句 主体 : 








class While 
def to ruby 
"->e{"+ 
" while (#{condition.to ruby}).call(e); e = (#{body.to ruby}).call(e); end;" + 
"e+ 
nh 人 
end 
end 


哪怕 是 一 个 简单 的 “while* 都 具有 一 个 元 长 的 表示 ， 所 以 有 必要 用 Ruby 解释 器 检查 一 下 
它 的 含义 正确 与 否 : 








>> Statement = 
While.new( 
LessThan.new(Variable.new(:x), Number.new(5)), 
Assign.new(:x, Multiply.new(Variable.new(:x), Number.new(3))) 


=> «while (x < 5) {x=x*3}» 

>> statement.to ruby 

=> "-> e { while (->e { (->e { el:x] }).call(e) < (-> e { 5 }).call(e) }).call(e); 
e=(->e {e.merge({ :x => (->e{(->e {el:x] }).call(e) * (-> e { 3 }).call(e) 
}).call(e) }) }).call(e); end; e }" 

>> proc = eval(statement.to ruby) 
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=> #<Proc (lambda)> 
>> proc.call({ x: 1 }) 
=> {:x=>9} 





语义 类 型 比较 
«while» 是 一 个 区 分 小 步 语义 、 大 步 语义 和 指称 语义 的 好 例子 。 


«while» 的 小 步 操作 语义 是 以 一 台 抽 和 象 机 器 的 归 约 规则 形式 写成 的 。 整 个 循环 并 不 是 规 
约 行为 的 一 部 分 一 一 规约 只 是 把 一 个 “whiley 语句 转 成 一 个 «if» 语句 但 是 它 会 作 
为 将 来 由 机 器 执行 的 规约 序列 的 一 部 分 。 为 了 理解 ewhile» 做 了 什么 ， 我 们 需要 考虑 
所 有 的 小 步 规则 ， 并 弄 懂 随 着 一 个 Simple 程序 的 执行 它们 之 间 是 如 何 互 相 作 用 的 。 


«while» 的 大 步 操 作 语义 是 以 一 个 求 值 规则 的 形式 写成 的 ， 这 个 规则 说 明 如 何 把 最 终 的 
环境 直接 计算 出 来 。 这 个 规则 包含 了 对 其 本 身 的 递归 调用 ， 因 此 明显 表明 “while 在 
求 值 过 程 中 会 引发 一 个 循环 ， 但 不 是 Simple 程序 员 芍 悉 的 那 种 循环 。 大 步 的 规则 是 递 
归 的 形式 ， 描 述 了 如 何 根据 对 其 他 语法 结构 的 求 值 对 一 个 表达 式 或 者 语句 完整 地 求 值 ， 
因此 这 个 规则 告诉 我 们 ， 对 一 个 «while» 语句 求 值 的 结果 可 能 会 依赖 于 一 个 不 同 环 境 
下 同样 语句 的 求 值 结 果 ， 但 把 这 种 思想 与 while 应 该 展现 的 选 代 方式 联系 起 来 需要 
跳跃 性 思维 。 幸 运 的 是 这 种 跳跃 并 不 太 大 : 一 点 点 的 数学 推理 可 以 表明 两 种 类 型 的 循 
环 在 本 质 上 是 等 价 的 ， 并 且 在 元 语言 支持 尾 调用 优化 的 时 候 ， 它 们 事实 上 也 是 等 价 的 。 


«while» 的 指称 语义 展示 了 如 何 用 Ruby 对 其 重 写 ， 也 就 是 如 何 通过 Ruby 的 while 关 
键 字 对 其 重 写 。 这 是 一 个 简单 直接 得 多 的 转换 : Ruby 提供 对 选 代 循 环 的 原生 支持 ， 而 
指称 规则 也 表明 kwhile» 能 用 Ruby 的 这 个 特性 实现 。 要 理解 这 两 种 类 型 的 循环 没有 
什么 困难 ， 所 以 如 果 我 们 理解 了 Ruby 中 while 循环 的 工作 方式 ， 也 能 理解 Simple 的 
«while» 循环 。 当 然 ， 这 意味 着 我 们 已 经 把 理解 Simple 的 问题 转换 成 了 理解 指称 语言 
的 问题 ， 而 如 果 指 称 语言 像 Ruby 一 样 庞大 而 且 定 义 不 良 ， 这 就 是 一 个 严重 的 缺点 ; 
但 在 有 一 个 能 用 来 写 指称 的 小 型 数学 语言 时 ， 这 就 成 了 一 个 优点 。 




















2.4.3 应 用 

做 完 所 有 这 些 工 作 之 后 ， 指 称 语义 完成 了 什么 目标 呢 ? 它 的 主要 目的 是 展示 如 何 把 Simple 
翻译 成 Ruby， 它 将 后 者 作为 工具 来 解释 不 同 的 语言 结构 是 什么 意思 。 这 恰巧 给 了 我 们 执 
行 Simple 程序 的 一 种 途径 一 一 因为 已 经 用 可 执行 的 Ruby 写 下 了 指称 语义 的 规则 ， 而 且 
这 些 规则 的 输出 本 身 就 是 可 执行 的 Ruby 一 一 但 这 只 是 偶然 事件 ， 因 为 我 们 之 前 有 可 能 
普通 的 英语 写 规则 并 用 一 些 数学 语言 写 下 指称 。 真 正 重要 的 是 我 们 自己 随意 设计 了 一 种 语 
言 ， 并 把 它 转换 成 一 种 其 他 人 或 者 其 他 东西 能 理解 的 语言 。 

为 了 赋予 这 种 转换 一 些 解释 能 力 ， 把 一 部 分 语言 含义 放 到 表面 而 不 再 只 是 隐 含 在 背后 会 非 
常 有 帮助 。 例 如 ， 这 种 语义 把 环境 表示 成 具体 的 Ruby 对 象 一 一 在 proc 中 传人 和 返回 的 散 
列 ， 而 不 是 把 Simple 中 的 变量 表示 成 真正 的 Ruby 变量 ， 然 后 依赖 Ruby 自己 微妙 的 变量 作 
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用 域 规则 去 定义 Simple 的 变量 访问 机 制 ， 这 样 表示 环境 更 为 明确 直接 。 在 这 方面 这 种 语义 
除了 把 解释 性 的 工作 交 给 Ruby， 还 多 做 了 一 些 事情 ， 它 把 Ruby 作为 一 个 简单 的 基础 ， 但 
是 在 表面 做 了 一 些 额 外 的 工作 ， 从 而 准确 地 展示 了 不 同 程序 结构 是 如 何 使 用 和 改变 环境 的 。 


这 之 前 我 们 看 到 过 ， 操 作 语 义 通 过 为 一 种 语言 设计 一 个 解释 器 来 解释 这 种 语言 的 含义 。 与 
此 对 比 ， 语 言 到 语言 的 指称 语义 更 像 是 一 个 编译 器 : 在 这 种 情况 下 ， 我 们 的 楷 o_ruby 实现 
高 效 地 把 Simple 编译 成 Ruby。 这 些 类 型 的 语义 虽然 都 对 如 何 为 一 种 语言 高 效 地 实现 一 个 
解释 器 或 者 编译 器 只 字 不 提 ， 但 确实 提供 了 一 个 基础 标准 可 以 检验 任何 生效 了 的 实现 。 


这 些 指 称 的 定义 还 在 一 些 语言 的 原始 状态 中 出 现 过 。 早 期 版 本 的 Scheme 标准 使 用 指称 
语 义 (http://www.schemers.org/Documents/Standards/R5RS/HTML/r5Srs-Z-H-10.html#%25_ 
sec_7.2) 定义 核心 语言 ， 而 不 像 现 在 的 标准 使 用 小 步 操作 语义 来 定义 ， 并 且 XSLT 文本 转 
换 语言 的 开发 是 由 Philip Wadler 对 XSLT 模式 (http://homepages.inf/ed.ac.uk/wadler/topics/ 
xml.html#xsl-semantics) 和 XPath 表达 式 (http://homepages.inf.ed.ac.uk/wadler/topics/xml. 
html#xpath-semantics) 的 指称 定义 来 引导 的 。 




















3.3.2 市 有 一 个 实际 使 用 指称 语义 定义 正则 表达 式 的 例子 。 


二 * 有 re 3 
2.5 形式 化 语义 实践 
对 于 为 计算 机 程序 赋予 含义 的 问题 ， 本 章 已 经 展示 了 几 种 不 同 的 方法 。 在 每 种 情况 下 ， 我 
们 都 已 经 避免 了 数学 化 的 方法 并 使 用 Ruby 了 解 了 它们 的 策略 ， 但 是 形式 化 的 语义 通常 都 
是 由 数学 化 的 工具 完成 的 。 








2.5.1 形式 化 

我 们 对 形式 语义 的 研究 并 不 是 特别 正式 。 一 直 没 有 认真 关注 过 数学 符号 ， 而 使 用 Ruby 作 
为 元 语言 意味 着 比 起 理解 程序 的 各 种 方式 ， 我 们 更 关注 执行 程序 的 不 同方 式 。 合 适 的 指称 
语义 关注 的 是 通过 把 程序 转换 成 定义 良好 的 数学 对 象 以 获得 程序 的 核心 含义 ， 关 心 的 是 把 
一 个 Simple 的 while» 语句 无 歧义 的 完整 表示 成 一 个 Ruby 的 while 循环 。 























为 了 提供 对 指称 语义 有 用 的 定义 和 对 象 ， 专 门 发 展 了 称 为 域 理论 的 数学 分 
， 它 采用 基于 单调 函数 上 不 动 点 的 一 种 计算 模型 ， 并 且 这 个 单调 函数 定义 
”在 偏 序 集合 上 。 我 们 可 以 通过 把 程序 “编译 ”成 数学 函数 来 理解 这 个 程序 ， 
并 且 域 理论 的 技巧 还 能 用 来 证 明 这 些 函数 一 些 有 趣 的 特性 。 













































































































































































另 一 方面 ， 尽 管 我 们 只 是 用 Ruby 含糊 地 概括 了 一 下 指称 语义 ， 但 关于 操作 语义 ， 我 们 已 
经 在 精神 上 接近 它 的 形式 化 表示 了 : 我 们 对 方法 拉 educe 和 #evaluate 的 定义 实际 上 只 是 
用 Ruby 翻译 的 数学 化 推理 规则 。 
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2.5.2 ”找到 含义 

形式 化 语义 的 一 个 重要 应 用 是 为 一 种 编程 语言 的 含义 给 出 一 个 无 歧义 的 定义 ， 而 不 是 让 其 
依赖 于 像 自 然 语 言 规范 文档 和 “由 实现 规范 ”这 样 更 加 随意 的 方法 。 形 式 化 的 定义 还 有 其 
他 用 途 ， 例 如 证 明 某 种 语言 通常 情况 下 的 特性 ， 以 及 特定 程序 在 特定 情况 下 的 特性 ， 证 明 
语言 中 程序 之 间 的 等 价 性 ， 研 究 如 何在 不 改变 程序 行为 的 情况 下 安全 地 变换 程序 而 使 其 效 


率 更 高。 

















例如 ， 既 然 操 作 语义 与 解释 器 的 实现 极为 接近 ， 那 么 计算 机 科学 家 就 可 以 把 一 个 适当 的 解释 
器 看 成 一 种 语言 的 操作 语义 ， 然 后 证 明 它 在 那 种 语言 的 指称 语义 方面 的 正确 性 一 一 这 意味 着 
证 明了 由 解释 器 给 出 的 含义 和 由 指称 语义 给 出 的 含义 之 间 存 在 着 明显 的 联系 。 





指称 语义 的 一 个 优点 是 比 操作 语义 抽象 层次 更 高 ， 它 忽略 了 程序 如 何 执行 的 细节 ， 而 只 关 
心 如 何 把 它 转 换 成 一 个 不 同 的 表示 。 例 如 ， 如 果 存 在 一 种 指称 语义 可 以 把 两 种 语言 翻译 成 
某 种 共通 的 表示 ， 就 使 对 不 同 语言 写成 的 两 个 程序 进行 比较 成 为 可 能 。 


抽象 程度 会 使 指称 语义 看 起 来 有 点 忽 围 子 。 如 果 问 题 是 如 何 解 释 一 种 程序 设计 语言 的 含 
义 ， 那 么 把 一 种 语言 翻译 成 另 一 种 语言 是 如 何 让 我 们 更 接近 问题 答案 的 呢 ? 一 个 指称 只 不 
过 与 它 的 含义 一 样 好 ， 尤 其 是 ， 如 果 指 称 的 语言 有 某 种 操作 性 的 含义 ， 那 么 一 个 指称 语义 
只 是 让 我 们 更 接近 于 能 实际 执行 一 个 程序 ， 这 个 语言 的 语义 本 身 展示 了 它 是 如 何 执行 的 ， 
而 不 是 如 何 翻 译 成 另 一 种 语言 的 。 


形式 化 的 指称 语义 使 用 抽象 的 数学 对 象 (通常 是 函数 ) 来 表示 表达 式 和 语句 这 样 的 编程 语 
言 结构 ， 并 且 因 为 数学 上 的 约定 会 规定 如 何 对 函数 求 值 这 样 的 事情 ， 这 就 有 了 一 种 直接 在 
操作 意义 上 思考 指称 的 方式 。 我 们 已 经 使 用 了 不 太 正 式 的 方式 ， 把 指称 语义 看 成 是 一 种 语 
言 到 另 一 种 语言 的 编译 器 ， 而 事实 上 这 是 多 数 编程 语言 最 终 得 以 执行 的 方式 : 一 个 Java 程 
序 将 会 由 javac 编译 成 字 节 码 ， 字 节 码 将 会 被 java 的 虚拟 机 即时 编译 成 x86 的 指令 ， 然 后 
一 个 CPU 会 把 每 一 条 x86 指令 解码 成 类 RISC (精简 指令 集 ) 的 微 指 令 放 到 一 个 核 上 去 执 
行 …… 它 会 在 什么 地 方 结束 呢 ?” 是 编译 器 ， 还 是 虚拟 机 ， 还 是 一 直 重复 下 去 ? 






























































当然 程序 最 终 会 执行 ， 因 为 语义 这 个 高 楼 会 到 达 底 部 暴露 出 实际 的 机 器 : 半导体 中 的 电 
子 ， 它 们 遵守 的 是 物理 法 则 。” 一 台 计 算 机 是 维护 这 个 不 确定 结构 的 装置 ， 大 量 复杂 的 解 
释 层 在 彼此 之 上 保持 稳定 平衡 ， 这 就 允许 多 点 触 控 手 势 这 样 人 体 尺 度 的 想法 和 while 循环 
这 样 的 想法 ， 都 能 被 逐渐 地 向 下 翻译 给 硅 和 电 的 物理 世界 。 





























2.5.3 备 选 方案 
本 章 你 已 经 看 到 了 许多 不 同名 称 的 语义 类 型 。 小 步 语义 还 叫 结构 化 操作 语义 (structural 





注 18: 或 者 ， 在 Charles Babbage 设计 的 分 析 机 这 种 机 械 计算 机 的 场景 下 ， 是 齿轮 和 纸 遵 守 物 理 规律 。 

















operational semantic) 和 转换 语义 (transition Semantic) ; 大 步 语义 更 普遍 的 叫 法 是 自然 语 
义 (natural semantic) 或 者 关联 语义 (relational semantic) ; 而 指称 语义 还 可 以 称 为 不 动 点 


语义 (fixed-point semantic) 或 者 数学 语义 (mathematical semantic ) 。 











还 有 其 他 类 型 的 形式 语义 可 用 。 其 中 一 个 就 是 公理 化 语义 (axiomatic semantic) ， 它 通过 在 
语句 执行 前 后 分 别 给 出 抽象 机 器 状态 的 断言 来 描述 一 个 语句 的 含义 : 如 果 一 个 断言 (前 置 
条 件 ) 在 语句 执行 前 初始 是 true， 那 么 随后 的 其 他 断言 (后 置 条 件 ) 将 是 true。 公 理化 
语义 在 验证 程序 的 正确 性 方面 很 有 用 : 随 着 语句 合 到 一 起 组 成 更 大 的 程序 ， 它 们 对 应 的 断 
言 也 能 合 到 一 起 组 成 更 大 的 断言 ， 其 目标 就 是 表明 对 一 个 程序 总 体 的 断言 与 它 的 预期 定义 
匹配 。 




















虽然 细节 有 所 不 同 ， 但 是 公理 化 语义 是 描述 RubySpec project 最 好 的 语义 类 型 ，RubySpec 
project (http://www.rubyspec.org) 是 “Ruby 程序 设计 语言 的 可 执行 规范 "， 它 使 用 RSpec 
类 型 的 断言 既 描 述 Ruby 的 核心 以 及 标准 库 ， 又 描述 Ruby 内 置 语言 结构 的 行为 。 例 如 ， 下 


面 是 RubySpec 描述 Array#<< 方法 的 片段 : 




















describe "Array#<<" do 
it "correctly resizes the Array" do 
a=[] 
a.size.should == 0 
a <x< :foo 
a.size.should == 1 
a << :bar << :baz 
a.size.should == 3 
a = [1, 2, 3] 
a.shift 
a.shift 
a.shift 
a xx :foo 
a.should == [:foo] 
end 


end 


2.6 ”实现 语法 解析 器 


本 章 ， 我 们 已 经 手工 构建 了 Simple 程序 的 抽象 语法 树 一 一 通过 手写 Assign.new(:x，Add. 
new(Variable.new(:x)，Number.new(1))) 这 样 的 普通 Ruby 表达 式 ， 而 不 是 先 写 'x = x + 
1' 这 样 原始 的 Simple 源 代 码 ， 然 后 使 用 一 个 语法 解析 器 自动 地 把 它 转 成 语法 树 。 

从 头 开 始 完整 地 实现 一 个 Simple 的 语法 解析 器 过 于 复杂 ， 会 分 散 我 们 讨论 形式 语义 的 注意 
力 。 尽 管 破 解 一 个 小 编程 语言 很 有 趣 ， 但 是 感谢 解析 工具 和 解析 库 的 存在 ， 在 他 人 工作 的 
基础 上 构造 一 个 语法 解析 器 并 不 是 特别 困难 ， 因 此 下 面 将 对 其 简单 介绍 一 下 。 









































Treetop (http://treetop.rubyforge.org/) 是 Ruby 可 用 的 语法 解析 工具 中 最 好 的 一 个 ， 它 是 一 
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种 特定 领域 的 语言 ， 能 让 语法 解析 器 自动 生成 。 一 种 语言 的 Treetop 描述 会 写成 解析 表达 
式 语 法 (parsing expression grammar)， 这 是 一 个 简单 的 类 正则 表达 式 (regular-expression- 
like ) 的 规则 集合 ， 既 易 写 又 易 理 解 。 最 好 的 是 ， 这 些 规则 能 够 使 用 方法 定义 作为 注释 ， 
这 样 的 话 ， 就 可 以 为 语法 解析 过 程 中 生成 的 Ruby 对 象 定义 行为 。Treetop 既 能 定义 语法 结 
构 ， 又 能 定义 基于 这 些 结构 进行 运算 的 Ruby 代码 集合 ， 这 使 Treetop 很 适合 描述 一 种 语言 
的 语法 并 赋予 它 可 执行 的 语义 。 

















为 了 让 我 们 体验 一 下 这 是 如 何 工作 的 ， 下 面 给 出 关于 Simple 的 Treetop 语法 简装 版 ， 它 只 
包含 解析 字符 串 “while (x < 5) { x =x * 3 }” 所 需要 的 规则 : 











grammar Simple 
rule statement 
while / assign 


rule while 
while (' condition:expression ') { ' body:statement ”} { 
def to ast 

While.new(condition.to ast, body.to ast) 








rule assign 


name:[a-z]+ ' = ' expression { 
def to ast 
Assign.new(name.text value.to sym, expression.to ast) 
end 
} 
end 


rule expression 
less than 
end 


rule less than 
left:multiply ' < ' right:less than { 
def to ast 
LessThan.new(left.to ast, right.to ast) 
end 
} 
/ 
multiply 
end 


rule multiply 
left:term ' * ' right:multiply { 
def to ast 
Multiply.new(left.to ast, right.to ast) 
end 


term 





end 


rule term 
number / variable 
end 


rule number 
[0-9]+ { 
def to ast 
Number.new(text value.to i) 
end 
} 
end 
rule variable 
[a-z]+ { 
def to ast 
Variable.new(text value.to sym) 
end 


上 
end 
end 


这 种 语言 看 起 来 有 点 像 Ruby， 但 这 种 相似 性 只 是 表面 的 ， 语 法 是 用 特别 的 Treetop 语言 写 
出 来 的 。 关 键 字 rule 为 分 析 一 种 特定 种 类 的 语法 引入 一 个 新 的 规则 ， 并 且 每 个 规则 里 的 表 
达 式 描述 了 它 将 要 识别 的 字符 串 结构 。 规 则 可 以 递归 地 调用 其 他 规则 一 一 例如 while 规则 
调用 表达 式 (expression) 规则 和 语句 (statement) 规则 一 一 而 且 分 析 从 第 一 条 规则 开始 ， 
这 是 这 种 语法 中 的 语句 。 

















这 些 表达 式 语法 规则 彼此 调用 的 顺序 反应 了 Simple 运算 符 的 优先 级 。 表 达 式 语法 调用 
less_than， 然 后 less_than 立即 调用 multiply， 在 less_than 对 优先 级 更 低 的 运算 符 < 进 
行 匹配 之 前 ，multiply 能 在 字符 串 中 匹配 到 * 运算 符 。 这 确保 表达 式 '1 * 2 < 3' 被 解析 
成 <(1 * 2) < 3 而 不 是 ct * (2 < 3)»。 





























为 了 让 事情 简单 ， 这 个 语法 没有 试图 限制 可 以 在 一 种 表达 式 中 出 现 的 另 一 种 
一 人 3 表达 式 种 类 ， 这 意味 着 这 个 表达 式 将 会 接受 一 些 明 显 错误 的 程序 。 



































例如 ， 对 于 二 元 表达 式 less_than 和 multiply， 我 们 设 定 了 两 个 规则 一 一 但 
是 分 别 设立 两 个 规则 的 唯一 原因 是 为 了 强调 运算 符 的 优先 级 ， 这 样 每 一 个 规 
则 只 要 求 一 个 更 高 优先 级 的 规则 匹配 其 左 侧 运算 对 象 ， 然 后 同样 或 者 更 高 优 
先 级 的 规则 匹配 其 右 侧 运 算 对 象 。 这 将 使 像 '1 < 2 < 3 这 样 的 字符 串 能 成 
功 通 过 解析 ， 即 便 Simple 的 语义 无 法 赋予 这 个 表达 式 结果 一 个 含义 。 
































这 些 问 题 中 有 一 些 可 以 通过 对 语法 稍 作 调整 得 以 解决 ， 但 是 总 会 有 其 他 一 些 
不 正确 的 情况 语法 解析 器 不 能 识别 。 这 一 问题 我 们 将 分 成 两 个 关注 点 ， 首 先 
保持 语法 解析 器 尽 可 能 的 自由 ， 其 次 将 在 第 9 章 使 用 一 个 不 同 的 技术 来 检测 
无 效 的 程序 。 

















io 边 带 上 括号 的 Ruby 代码 标注 。 在 每 一 个 括号 里 ， 代 码 都 定 
一 个 叫 撼 o_ast 的 方法 ， 在 解析 一 个 Simple 程序 的 时 候 ， 它 能 用 在 由 Treetop 构建 的 对 
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果 把 这 个 语法 保存 到 叫 作 simple.treetop 的 文件 里 ， 我 们 可 以 使 用 Treetop 加 载 它 来 生 


成 一 个 SimpleParser 类 。 这 个 解析 器 可 以 把 一 个 由 Simple 源 代码 组 成 的 字符 串 转 换 成 由 








Treetop 的 SyntaxNode 对 象 构建 出 来 的 一 个 表示 : 


>> require 'treetop' 

=> true 

>> Treetop.1oad('simple') 

=> Simpleparser 

>> parse tree = SimpleParser.new.parse('while (x < 5){x=x*3}') 

=> SyntaxNode+While1i+Whileo offset=0, "...5) { x = x * 3 }" (to ast,condition,body): 
SyntaxNode offset=0, "while (" 
SyntaxNode+LessThan1+LessThan0 offset=7, "x < 5" (to ast,1left,right): 

SyntaxNode+Variable0 offset=7, "x" (to ast): 

SyntaxNode offset=7, "x" 
SyntaxNode offset=8, " < " 
SyntaxNode+NumbeT0 offset=11, "5" (to ast): 

SyntaxNode offset=11, "5 

SyntaxNode offset=12, ") {" 
SyntaxNode+Assign1+Assign0 offset=16, "x = x * 3" (to ast,name,expression): 
SyntaxNode offset=16, "x": 
SyntaxNode offset=16, "x" 
SyntaxNode offset=17, "=" 
SyntaxNode+Multiply1+MultiplyO offset=20, "x * 3" (to ast,left,right): 
SyntaxNode+Variable0 offset=20, "x" (to ast): 
SyntaxNode offset=20, "x" 
SyntaxNode offset=21, " * " 
SyntaxNode+Number0 offset=24, "3" (to ast): 
SyntaxNode offset=24, "3" 
SyntaxNode offset=25, " }" 























这 个 SyntaxNode 结构 是 一 个 具体 语法 树 : 它 专 门 为 了 Treetop 的 处 理 而 设计 ， 并 且 含 有 





关于 这 个 具体 语法 树 的 市 点 是 如 何 与 生成 它们 的 原始 代码 关联 起 来 的 大 量 信息 。 下 面 是 








| 下 





Treetop 文档 (http://treetop.rubyforge.org/using_in_ruby_html) 不 得 不 说 的 一 些 话 : 


自己 向 下 遍历 语法 树 ， 并 且 不 要 把 这 棵 树 的 结构 作为 你 自己 常用 的 数 
结构 。 它 包含 的 节点 比 你 应 用 程序 所 需要 的 要 多 得 多 ， 其 至 为 输入 的 每 个 字符 

ee 

但 是 ， 你 可 以 为 根 规则 增加 方法 ， 根 规则 以 一 种 合理 的 格式 返回 你 需要 的 信息 。 

每 个 规则 可 以 调用 它 的 子规 则 ， 并 且 从 外 面 尝 试 遍历 树 时 ， 利 用 这 些 遍历 语法 树 

的 方法 是 一 个 非常 好 的 选择 。 


这 就 是 我 们 已 经 做 到 的 。 我 们 疫 有 直接 操纵 这 棵 乱糟糟 的 树 ， 而 是 使 用 请 法 中 的 标记 在 每 
个 节点 上 定义 一 个 枇 o_ast 方法 。 如 果 在 根 节 点 上 调用 这 个 方法 ， 它 会 根据 Simple 的 语法 





对 象 构 建 一 棵 抽象 语法 树 。 


>> statement = parse tree.to ast 
=> «while (x < 5) {x=x*3}» 


这 样 我 们 已 经 自动 地 把 源 代码 转换 成 了 一 棵 抽象 语法 树 ， 并 且 现 在 可 以 使 用 这 棵 树 以 通常 
的 方式 查看 程序 的 含义 了 : 


>> statement .evaluate({ x: Number.new(1) }) 

=> {:x=>«9»} 

>> statement.to ruby 

=> "-> e { while (->e { (->e { e[:x] }).call(e) < (-> e { 5 }).call(e) }).call(e); 
e= (->e { e.merge({ :x => (-> e { (-> e { ef:x] }).call(e) * (-> e { 3 }).call(e) 
}).call(e) }) }).call(e); end; e }" 





这 个 解析 器 和 Treetop 通常 还 有 一 个 缺点 ， 就 是 生成 一 个 右 结合 的 具体 语法 树 。 

一 CE》 这 意味 着 字符 让 ,1 * 2 * 3 * 4 被 解 折 时 会 被 当成 : ,1 * (2 * (3 * 用) 

>> expression = SimpleParser.new.parse('1 * 2 * 3 * 4', root: :expression).to ast 

= L223 A 

>> expression.left 

=> «1» 

>> expression.right 

=> «2 * 3 * 4» 
但 是 乘法 通常 是 左 结合 的 : 写 '1 * 2 * 3 * 4' 的 时 候 ， 我 们 实际 的 意思 古 
"((1 * 2) * 3) * 4'， 这 里 数字 是 从 表达 式 的 左边 (而 非 右 边 ) 开始 分 组 结 
合 的 。 对 乘法 来 说 这 没什么 关系 一 一 求 值 的 时 候 两 种 方式 会 产生 同样 的 结 
果 一 一 但 对 像 减 法 和 除法 这 样 的 运算 就 有 问题 了 ， 因 为 对 «((1 - 2) - 3) - 4» 
求 值 的 结果 与 对 «1 - (2 - (3 - 4))» 求 值 的 结果 并 不 相同 。 
为 了 修正 这 个 缺点 ， 我 们 不 得 不 让 这 些 规则 和 枇 o_ast 实现 得 更 加 复杂 一 
些 。 参 考 6.2.3 节 ， 那 里 有 构建 左 结合 AST 的 Treetop 语法 。 
能 够 像 这 样 解析 Simple 程序 很 方便 ， 但 是 因为 困难 的 工作 都 由 Treetop 做 了 ， 所 以 我 们 对 
一 个 语法 解析 器 实际 如 何 工作 并 没有 了 解 多 少 。 在 4.3 市 ， 你 将 会 看 到 如 何 直 接地 实现 一 
个 解析 器 。 
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最 简单 的 计算 机 








短 短 的 几 年 里 ,我 们 已 经 身 处 计算 机 的 海洋 。 本 来 它们 都 安全 地 隐藏 在 军事 研究 中 心 和 大 
学 实验 室 中 ， 但 现在 已 经 随处 可 见 : 我 们 的 办 公 桌 上 ， 我 们 的 口袋 里 ， 汽 车 的 发 动机 置 
下 ， 甚 至 植 和 了 我 们 的 身体 。 作 为 程序 员 ， 我 们 每 天 都 在 使 用 精密 的 计算 机 ， 但 对 它们 的 
工作 方式 了 解 多 少 呢 ? 





现代 计算 机 的 强大 能 力 伴随 着 过 多 的 复杂 性 。 我 们 很 难 理解 一 台 计 算 机 多 个 子 系统 的 全 部 
细节 ， 更 别 说 理解 那些 子 系统 如 何 互 相 协作 从 而 构成 整个 系统 了 。 这 些 复杂 性 使 得 对 真实 
计算 机 的 能 力 与 行为 进行 直接 推导 显得 不 切实 际 ， 此 时 计算 机 的 简化 模型 就 显得 很 有 用 
了 ， 虽 然 模型 只 是 提取 出 真实 计算 机 中 令 人 感 兴趣 的 特性 ， 但 它 确 实 能 够 帮助 人 们 建立 完 
整 的 认识 。 








本 章 ， 我 们 将 抽 丝 剥 草 ， 揭 开 计算 机 的 本 质 ， 看 看 它 到 底 能 干 些 什么 ， 并 考察 这 样 一 台 简 
单 计算 机 所 能 完成 工作 的 极限 。 


3.1 确定 性 有 限 目 动 机 


现实 中 ， 计 算 机 通常 都 有 大 量 的 易 失 存储 器 (RAM) 和 非 多核 易 失 存储 器 (硬盘 或 者 
SSD)， 有 许多 输入 /输出 设备 ， 还 有 能 同时 执行 多 个 指令 的 处 理 器 。 有 限 状态 机 (finite 
state machine)， 也 叫 有 限 自 动机 (finite automaton) ， 是 一 台 计 算 机 的 极 简 模 型 ， 为 了 容易 
理解 、 推 导 并 且 容 易 用 硬件 或 软件 实现 ， 它 放弃 了 上 面 所 有 的 这 些 特性 。 











忆 
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3.1.1 状态、 规则 和 输入 

有 限 自动 机 没有 持久 化 的 存储 并 且 几 乎 没有 RAM。 它 只 是 一 台 小 机 器 ， 拥 有 一 些 可 能 的 
状态 ， 并 能 够 跟踪 到 自己 当前 有 具体 处 于 其 中 的 哪个 状态 一 一 试 着 把 它 看 成 一 台 RAM 只 够 
存储 一 个 值 的 计算 机 。 同 样 ， 有 限 自 动机 没有 键盘 、 鼠 标 和 接收 输入 的 网 络 接口 ， 只 有 一 
个 外 部 的 字符 输入 流 可 以 一 次 读 取 一 个 字符 。 








每 台 有 限 自 动机 没有 通用 的 CPU 执行 任意 程序 ， 而 是 硬 编码 了 一 些 规 则 集合 ， 以 决定 在 
相应 的 输入 下 如 何 从 一 个 状态 切换 到 另 一 个 状态 。 自 动机 先 从 一 个 特定 的 状态 开始 ， 然 后 
从 输入 流 中 读 入 字符 一 一 按照 规则 它 每 次 读 取 一 个 字符 。 


下 面 是 一 台 有 限 自动 机 的 结构 图 : 


-@ 


两 个 圆 代表 自动 机 的 两 个 状态 一 一 1 和 2。 凭空 出 现 的 箭头 表明 这 人 台 自 动机 从 状态 1 开始 ， 
1 是 它 的 起 始 状态 。 两 个 状态 之 间 的 箭头 代表 机 器 的 规则 : 

。 处 于 状态 1 并 且 读 入 字符 a 时 ， 切 换 到 状态 2 

。 处 于 状态 2 并 且 读 入 字符 a 时， 切换 到 状态 1。 


























这 让 我 们 有 足够 的 信息 研究 机 器 如 何 处 理 一 个 输入 流 。 











。 这 台 机 器 从 状态 1 开始 。 
这 台 机 器 只 有 从 输入 流 读 入 字符 3 的 规则 ， 因 此 这 是 唯一 能 发 生 的 事情 。 读 取 到 a 的 时 

候 ， 它 会 从 状态 1 切换 到 状态 2。 

当 这 人 台 机 器 又 读 取 到 了 一 个 a 时 ， 它 会 切换 回 状 态 1 。 





一 旦 回 到 状态 1， 它 又 将 开始 重复 自身 ， 这 就 是 这 人 台 机 器 的 行为 范围 。 我 们 可 以 认为 当前 
状态 的 信息 存在 于 机 器 内 部 一 一 它 像 一 个 “ 黑 盒 ”一 样 运转 ， 并 不 会 展现 其 内 部 工作 状 
况 一 一 这 人 台 无 聊 的 机 器 毫 无 用 处 ， 没 有 任何 能 观察 到 的 输出 。 即 使 这 人 台 机 器 一 直 在 状态 1 
和 状态 2 之 间 切 换 ， 机 器 之 外 也 没有 一 个 人 能 看 出 来 有 什么 事情 在 发 生 。 因 此 在 这 种 情况 
下 ， 我 们 可 能 还 要 增加 一 个 状态 ， 这 样 就 不 用 再 为 任何 内 部 结构 操心 了 。 


3.1.2 输出 

为 了 解决 这 个 问题 ， 有 限 自 动机 还 有 一 个 产生 输出 的 基本 方法 。 与 现实 中 计算 机 复杂 的 和 输 
出 能 力 相 比 这 不 值 一 提 ， 我 们 只 是 把 一 些 状 态 标记 成 特别 状态 ， 并 且 认 为 机 器 的 单 比 特 输 
出 提供 了 当前 是 否 处 于 特别 状态 的 信息 。 对 于 这 人 台 机 器 ， 我 们 将 状态 2 作为 特别 状态 ， 并 
在 图 中 用 双重 的 圆 形 表示 它 。 
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全. 败 


这 些 特定 状态 通常 称 为 接受 状态 ， 表 明 这 人 台 机 器 对 某 个 输入 序列 是 接受 还 是 拒绝 。 如 果 这 
台 自 动机 从 状态 1 开始 并 读 入 一 个 a， 它 将 会 停留 在 状态 2， 这 是 一 个 接受 状态 ， 因 此 我 
们 可 以 说 这 台 机 器 接受 字符 串 'a'。 另 外 ， 如 果 它 先 读 到 一 个 a， 然 后 又 读 取 了 另 一 个 a， 
Ar re iss es on tp 


看 到 ， 这 上 a'、'aaa' 、'aaaaa' 都 能 被 接受 ， 
但 是 'aa'、'aaaa' 和 '' ( 空 字 符 捉 ) 会 被 拒绝 。 


























现在 有 了 稍 有 用 一 些 的 东西 : ee 上 列 ， 并 且 提 供 一 个 “是 
/ 否 ”的 输出 ， 以 表明 这 个 序列 是 否 已 经 被 接受 。 公 道 地 说 ， 这 个 DFA (Deterministic 
Finite Automata) 正在 执行 计算 ， 因 为 我 们 可 以 向 它 提问 “这 个 字符 串 的 长 度 是 奇数 
吗 ? ”一 一 然后 得 到 一 个 有 意义 的 答案 。 它 足以 称 为 简单 计算 机 了 ， 并 且 我 们 可 以 将 它 的 
特性 与 一 台 现 实 中 的 计算 机 进行 对 比 : 























真实 计算 机 有 限 自动 机 
持久 存储 硬盘 或 者 SSD 无 
临时 存储 RAM 当前 状态 
输入 键盘 、 鼠 标 、 网 络 等 字符 流 
输出 显示 设备 、 话 简 、 网 络 等 当前 状态 是 否 为 一 个 接受 状态 (是 / 否 ) 
处 理 器 能 执行 任何 程序 的 CPU 核心 根据 输入 改变 状态 的 硬 编码 规则 
当然 ， 这 人 台 自 动机 不 做 任何 精细 或 者 有 用 的 工作 ， 但 是 我 们 可 以 构造 更 复杂 的 自动 机 ， 让 





它 拥 有 更 多 的 状态 并 且 能 够 读 取 多 个 字符 。 下 面 的 自动 机 有 三 个 状态 ， 并 且 能 够 读 取 输 入 
a 和 0b: 





b a a,b 
-OO"@ "© 
机 器 接受 'ab'、'baba' 以 及 'aaaab' 这 样 的 字符 串 ， 并 且 拒 绝 'a  、 ' baa 和 “bbbba' 


这 台 
这 样 的 字符 串 。 实验 表明 ， 它 只 接受 包含 序列 'ab' 的 字符 串 ， 因 此 仍然 没有 多 大 用 ， 但 至 
展现 了 一 定 程度 的 精妙 之 处 。 本 章 后 面 我 们 将 看 到 更 实际 的 应 用 。 








> 





3.1.3 ”确定 性 
很 明显 ， 这 种 自动 机 具有 确定 性 : 不 管 它 当前 处 于 什么 状态 ， 并 且 不 管 读 入 什么 字符 ， 最 
终 所 处 的 状态 总 是 完全 确定 的 。 只 要 满足 下 面 两 个 约束 ， 就 能 保证 这 种 确定 性 。 
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。 没有 冲突 不 存在 这 样 的 状态 : 它 的 下 一 次 转换 状态 因为 有 彼此 冲突 的 规则 而 有 二 义 性 。 
(这 意味 着 一 个 状态 对 于 同样 的 输入 ， 不 能 有 多 个 规则 ) 

。 没有 遗漏 ”不 存在 这 样 的 状态 : 它 的 下 一 次 转换 状态 因为 缺失 规则 而 未 知 。( 这 意味 着 
每 个 状态 都 必须 针对 每 个 可 能 的 输入 字符 有 至 少 一 个 规则 。) 


综 上 所 述 ， 这 些 约束 意味 着 对 每 一 个 状态 和 输入 的 组 合 ， 这 台 机 器 一 定 要 恰好 有 一 个 规 
则 。 遵 守 这 些 确定 性 约束 的 机 器 有 一 个 技术 名 称 ， 就 是 确定 性 有 限 自动 机 (Deterministic 








Finite Automaton, DFA ), 


3.1.4 ”模拟 





确定 性 有 限 自动 机 是 计算 的 抽象 模型 。 我 们 已 经 画 了 一 些 示 例 机 器 的 简 图 ， 而 且 思 考 了 它们 











的 行为 ,但 是 这 些 机 器 实际 上 并 不 存在 ， 因 此 我 们 不 能 真正 给 它们 一 些 输 入 然后 看 它们 的 表 
现 。 幸 运 的 是 ，DFA 非常 简单 ， 我 们 很 容易 用 Ruby 对 其 进行 模拟 ， 然 后 直接 与 它 交互 。 











让 我 们 通过 实现 一 个 规则 集合 对 其 进行 模拟 ， 并 把 这 个 规则 集合 称 为 规则 手册 (rulebook) : 


class FARule < Struct.new(:state, :character, :next state) 


def applies to?(state, character) 


self.state == state 8& self.character == character 


end 
def follow 
next_state 


end 


def inspect 


"#<FARule #{state.inspect} --#{character}--> #{next state.inspect}>" 


end 
end 


class DFARulebook < Struct.new(:rules) 
def next state(state, character) 
rule for(state, character).follow 
end 


def rule for(state, character) 


rules.detect { |rule| rule.applies to?(state, character) } 


end 
end 


这 段 代 码 为 规则 建立 了 一 个 简单 的 API: 每 个 规则 都 有 一 个 #applies_to? 方法 (这 个 方法 会 








返回 true 或 者 false， 指 示 这 个 规则 是 否 可 以 丰 





E 某 个 特定 情况 下 应 用 ) ， 还 有 一 个 革 ollow 方 








法 (在 决定 采用 某 条 规则 后 返回 关于 机 器 应 该 如 何 改变 的 信息 )。 DFARulebook#next_state 




















注 1: 这 个 设计 足够 通用 ， 可 以 适应 不 同 种 类 的 机 器 和 规则 ， 因 此 在 本 书 稍 后 情况 更 复杂 的 情况 下 我 们 还 可 











以 重用 它 。 
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使 用 这 些 方法 定位 到 正确 的 规则 ， 并 找到 DFA 接 下 来 的 状态 。 


通过 使 用 Enumerable#detect，DFARulebook#next_state 的 实现 假定 总 是 恰好 有 

心 。 一 个 规则 应 用 到 给 定 的 状态 和 字符 上 。 如 果 可 用 的 规则 超过 一 个 ， 那 么 上 只 有 

必 ， 第 一 个 能 起 作用 ， 其 他 规则 都 会 被 忽略 ， 如 果 没 有 可 以 应 用 的 规则 ，#detect 
调用 会 返回 ni1l， 并 且 在 试图 调用 nil.follow 的 时 候 模 拟 进程 会 央 演 。 
































这 就 是 为 什么 这 个 类 叫 DFARulebook 而 不 是 FARulebook 了 : 它 只 是 在 确定 性 
约束 满足 的 情况 下 才 正 确 工作 。 


一 个 规则 手册 能 够 把 许多 规则 封装 到 一 个 对 象 里 ， 然 后 询问 它 接 下 来 是 什么 状态 : 


>> rulebook = DFARulebook.new([ 
FARule.new(1, 'a', 2), FARule.new(1, 'b', 1), 
FARule.new(2, 'a', 2), FARule.new(2, 'b', 3), 
FARule.new(3, 'a', 3), FARule.new(3, 'b', 3) 


]) 
=> #<struct DFARulebook ...> 
>> rulebook.next state(1, 'a') 
=> 2 
>> rulebook.next_state(1, 'b') 
=> 1 
>> rulebook.next state(2, 'b') 
二 3 





` 4 、 丁 能 把 这 些 状 态 区 分 开 来 : 我 们 对 DFARulebook#next_state 的 实现 需要 能 够 
、 Py = 


比较 两 个 状态 ， 以 判定 它们 是 否 相 同 ， 但 并 不 关心 那些 对 象 是 数字 、 符 号 、 
字符 串 、 散 列 ， 还 是 0bject 类 的 匿名 实例 。 


4 此 处 我 们 面临 一 个 选择 ， 即 如 何 把 自动 机 的 状态 表示 成 Ruby 的 值 。 重 点 在 
4 
le 








在 这 种 情况 下 ， 最 清晰 的 方式 是 使 用 普通 的 Ruby 数字 一 一 它们 能 很 好 地 
配 图 中 带 编号 的 状态 ， 因 此 我 们 就 是 这 么 做 的 。 





加 











有 了 一 个 规则 手册 之 后 ， 我 们 可 以 用 它 来 构建 一 个 DFA 对 象 ， 以 跟踪 它 的 当前 状态 ， 并 且 
可 以 报告 它 当前 是 否 处 于 接受 状态 : 





class DFA < Struct.new(:current state, :accept states, :rulebook) 
def accepting? 
accept states.include?(current state) 
end 
end 


>> DFA.new(1, [1, 3], rulebook).accepting? 
=> true 

>> DFA.new(1, [3], rulebook).accepting? 

=> false 
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现在 可 以 写 一 个 方法 从 输入 中 读 取 一 个 字符 ， 然 后 查阅 规则 手册 ， 再 相应 地 改变 状态 : 





class DFA 
def read character(character) 
self.current state = rulebook.next state(current state, character) 
end 
end 


为 DFA 输入 字符 串 ， 然 后 观察 它 输 出 的 改变 : 


>> dfa = DFA.new(1, [3], rulebook); dfa.accepting? 

=> false 

>> dfa.read character('b'); dfa.accepting? 

=> false 

>> 3.times do dfa.read character('a') end; dfa.accepting? 
=> false 

>> dfa.read character('b'); dfa.accepting? 

=> true 


一 次 只 向 DFA 输入 一 个 字符 有 些 不 方便 ， 所 以 添加 一 个 方便 的 方法 来 读 取 输入 的 整个 字 
符 串 : 


class DFA 
def read string(string) 
string.chars.each do |character| 
read character(character) 
end 
end 
end 














现在 可 以 向 DFA 输入 整个 字符 串 了 ， 而 不 再 只 是 分 别传 人 单个 字符 : 





>> dfa = DFA.new(1, [3], rulebook); dfa.accepting? 
=> false 

>> dfa.read string('baaab'); dfa.accepting? 

=> true 


一 旦 DFA 获得 了 一 些 输入 ， 它 就 可 能 不 再 处 于 起 始 状 态 了 ， 因 此 我 们 不 能 再 次 使 用 它 检 
查 输入 的 一 个 新 的 完整 序列 。 这 意味 着 要 从 头 创建 它 一 一 像 以 前 那样 使 用 同样 的 起 始 状 
态 、 接 受 状态 和 规则 手册 一 一 每 当 想 要 检查 它 是 否 接 受 一 个 新 的 字符 串 时 。 我 们 可 以 在 
一 个 对 象 里 封装 它 的 构造 参数 来 避免 手工 执行 这 一 操作 ， 这 个 对 象 表示 设计 出 来 的 特定 
AR es 有 要 检查 是 否 可 以 接受 一 个 新 的 字符 串 ， 就 靠 此 对 象 自动 地 构建 那个 DFA 








class DFADesign < Struct.new(:start state, :accept states, :rulebook) 
def to dfa 
DFA.new(start state, accept states, rulebook) 
end 


def accepts?(string) 





to dfa.tap { |dfal| dfa.read string(string) }.accepting? 





end 
end 
EE 已， 
4 | ttap 方法 对 一 个 代码 块 求 值 ， 然 后 返回 调用 它 的 对 象 。 
有 
DFADesign#accepts? 使 用 DFADesign#to dfa 方法 创建 一 个 DFA 的 新 实例 ， 然 后 调用 #read_ 





string? 把 它 放 到 一 个 接受 态 或 者 拒绝 态 里 : 


>> dfa design = DFADesign.new(1, [3], rulebook) 
=> #<struct DFADesign ...> 

>> dfa design.accepts?('a') 

=> false 

>> dfa design.accepts?('baa') 

=> false 

>> dfa design.accepts?('baba') 

=> true 


3.2 ” 非 确定 性 有 限 目 动机 


DFA 理解 和 实现 起 来 都 很 简单 ， 但 那 是 因为 它 与 我 们 熟悉 的 机 器 非常 相似 。 在 去 除 一 
台 真 实 计 算 机 的 所 有 复杂 性 之 后 ， 我 们 有 机 会 使 用 不 大 常见 的 思想 进行 实验 了 ， 这 将 让 
我 们 远离 熟悉 的 机 器 ， 并 可 以 不 必 处 理 把 这 些 思想 落实 到 真实 系统 中 时 可 能 遇 到 的 各 种 
困难 。 


一 种 探索 方式 是 去 掉 我 们 现 有 的 假设 和 约束 。 首 先 ， 确 定性 约束 似乎 是 个 限制 ， 可 能 我 们 
并 不 关心 每 个 状态 上 每 个 可 能 的 输入 ， 那 么 为 什么 不 能 忽略 不 关心 的 字符 处 理 规则 ， 而 假 
设 异 常 发生 时 这 台 机 器 能 进入 到 一 个 通用 的 失败 状态 呢 ?” 更 异乎 寻常 的 是 ， 如 果 允 许 这 台 
机 器 拥有 互相 对 立 的 规则 ， 以 致 有 多 条 可 能 的 执行 路 径 ， 这 将 意味 着 什么 呢 ? 我 们 之 前 的 
设置 还 假设 ， 每 一 个 状态 改变 一 定 对 应 从 输入 流 读 入 一 个 字符 ， 但 是 如 果 在 不 进行 读 取 的 
时 候 机 器 也 能 改变 状态 ， 将 会 怎样 呢 ? 

在 这 一 节 ， 我 们 将 探索 这 些 想法 ， 在 对 有 限 自 动机 的 能 力 稍 做 调整 之 后 ， 看 看 是 否 有 什么 
新 的 可 能 性 。 


3.2.1 非 确定 性 
假设 我 们 想 要 一 台 有 限 自动 机 ， 它 能 接受 由 a 和 4b 组 成 的 第 三 个 字符 是 b 的 任意 字符 串 。 此 
时 很 容易 想 出 一 个 合适 的 DFA 设计 : 
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如 果 想 要 一 台 机 器 能 接受 倒数 第 三 个 字符 是 b 的 字符 串 ， 怎 么 办 呢 ? 那 将 如 何 工 作 呢 ? 似 
乎 更 加 困难 : 上 面 的 DFA 能 保证 在 读 第 三 个 字符 的 时 候 处 于 状态 3， 但 是 一 台 机 器 无 法 
预先 知道 什么 时 候 能 读 到 倒数 第 三 个 字符 ， 因 为 在 结束 读 取 之 前 它 不 知道 这 个 字符 串 有 多 
长 。 甚 至 这 样 的 一 台 DFA 是 否 可 能 存在 都 不 一 定 能 立刻 清楚 。 











但 是 ， 如 果 我 们 放松 确定 性 的 限制 ， 并 且 允 许 规则 手册 对 于 一 个 状态 和 输入 包含 多 条 规则 
(或 者 根本 没有 规则 ) ， 那 么 就 可 以 设计 一 台 能 完成 任务 的 机 器 : 


ab 


2 
， 
-OO*© 全 


这 是 一 台 非 确定 性 有 限 自动 机 (NFA) ， 对 每 一 个 输入 序列 不 再 只 有 一 条 执行 路 径 。 处 于 
状态 1 并 且 读 入 b 的 时 候 ， 它 可 能 会 按照 一 条 规则 仍 保持 在 状态 1， 但 也 可 能 会 按照 另 
一 条 规则 进入 状态 2。 反 过 来 ， 一 旦 进入 状态 4， 它 找 不 到 任何 规则 可 以 遵守 ， 因 此 疫 法 
再 继续 读 取 输 入 。 一 台 DFA 的 下 一 状态 总 是 完全 由 它 的 当前 状态 和 输入 决定 ， 但 是 一 台 
NFA 在 向 下 一 个 状态 转移 时 会 有 多 种 可 能 性 ， 而 且 有 时 候 根 本 无 法 转移 。 


如 果 一 台 DFA 读 取 一 个 字符 串 然后 完全 按照 规则 执行 ， 并 且 最 终 终 止 于 一 个 接受 状态 ， 
那 它 就 能 接受 这 个 字符 串 。 那 么 对 于 一 台 NFA 来 说 ， 什 么 才能 表示 一 台 NFA 接受 或 者 拒 
绝 一 个 字符 串 呢 ? 很 自然 的 回答 是 ， 如 果 存 在 某 条 路 径 能 让 NFA 按照 它 的 某 些 规则 执行 
并 终止 于 一 个 接受 状态 ， 那 它 就 能 接受 这 个 字符 串 ; 这 就 是 说 ， 即 使 不 是 必然 的 ， 只 要 终 
止 于 一 个 接受 状态 是 可 能 的 就 可 以 。 
























































例如 ， 这 台 NFA 接受 字符 串 “baa' ， 因 为 从 状态 1 开始 ， 有 一 条 路 径 可 以 让 这 人 台 机 器 读 取 
一 个 b 转移 到 状态 2， 再 读 取 一 个 a 转移 到 状态 3， 最 后 读 一 个 a 终止 于 状态 4， 这 是 一 个 
接受 态 。 它 还 接受 字符 串 'bbbbb' ， 因 为 NFA 可 以 在 读 取 前 两 个 b 的 时 候 ， 按 照 另 一 条 规 
则 执行 并 停留 在 状态 1， 然 后 在 读 第 三 个 b 的 时 候 使 用 规则 转移 到 状态 2， 再 读 取 字 符 串 
的 其 他 部 分 ， 并 向 以 前 那样 终止 于 状态 4。 
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另 一 方面 ， 没 有 读 取 “abb 并 终止 于 状态 4 的 方法 (取决 于 遵照 的 不 同 规则 ， 它 最 终 只 能 
终止 于 状态 1、2 或 者 3)， 因 此 这 台 NFA 不 接受 'abb' 。'bbabb' 也 不 行 ， 它 最 多 只 能 到 








达 状 态 3: 如 果 读 入 第 一 个 b 的 时 候 直接 转移 到 状态 2， 它 将 很 快 终止 于 状态 4， 这 样 留 下 
两 个 字符 没有 处 理 但 是 已 经 没有 规则 可 用 了 。 


能 被 一 台 特定 机 器 接受 的 字符 串 集合 称 为 一 种 语言 :我 们 说 这 台 机 器 识别 了 
4 4 ， 这 种 语言 。 不 是 所 有 的 语言 都 有 一 台 DFA 或 者 NFA 能 识别 它们 ( 详 见 第 4 
必 ， 章 ) ， 但 那些 能 被 有 限 自动 机 识别 的 语言 称 为 正则 语言 (regularlanguage)。 





放松 确定 性 约束 已 经 造就 了 一 台 虚 拟 机 器 ， 这 台 虚 拟 机 器 与 我 们 现实 中 熟悉 的 确定 性 机 器 
差别 很 大 。 一 台 NFA 按照 可 能 性 而 不 是 确定 性 工作 : 我 们 根据 可 能 发 生 的 而 不 是 将 要 发 
生 的 来 讨论 它 的 行为 。 这 似乎 很 强大 ， 但 是 这 样 的 机 器 在 现实 世界 中 如 何 工作 呢 ? 初 看 上 
去 ， 现 实 中 一 台 NFA 的 实现 需要 某 种 预见 性 ， 要 在 读 取 输 入 的 时 候 从 几 种 可 能 性 中 做 出 
选择 : 为 了 保留 接受 一 个 字符 串 的 可 能 ， 示 例 NFA 一 定 要 在 读 到 倒数 第 三 个 字符 之 前 保 
持 在 状态 1， 但 它 没 法 知道 还 将 收 到 多 少 个 字符 。 我 们 怎么 用 乏味 又 确定 的 Ruby 模拟 这 
样 一 台 激 动人 心 的 机 器 呢 ? 








在 确定 性 计算 机 上 模拟 一 台 NFA， 关 键 是 找到 一 种 方法 探索 出 这 台 机 器 所 有 可 能 的 执行 。 
这 种 暴力 方法 把 所 有 的 可 能 全 都 摆 出 来 ， 以 此 避免 了 只 模拟 一 种 可 能 执行 时 所 需要 的 “ 幽 
灵 般 ”的 预见 性 。 一 台 NFA 读 到 一 个 字符 的 时 候 ， 它 下 一 步 转移 到 什么 状态 只 会 有 有 限 
数目 的 可 能 性 ， 因 此 我 们 模拟 非 确 定性 时 可 以 尝试 遍历 所 有 可 能 ， 然 后 看 它们 中 哪个 最 终 
到 达 一 个 接受 状态 。 


尝试 遍历 所 有 可 能 时 可 以 采用 递归 的 方式 : 每 当 所 模拟 的 NFA 读 取 一 个 字符 并 且 有 多 个 
可 用 的 规则 时 ， 遵 照 其 中 的 一 条 规则 ， 然 后 尝试 读 取 输入 的 后 续 部 分 ， 如 有 果 这 没有 让 机 器 
到 达 一 个 可 接受 状态 ， 就 回 退 到 早期 状态 ， 把 输入 也 倒 回 早期 的 位 置 ， 然 后 按照 另 一 个 不 
同 的 规则 再 次 尝试 ， 如 此 重复 ， 直 到 某 次 选择 的 规则 让 机 器 到 达 一 个 接受 状态 ， 或 者 所 有 
可 能 的 选择 进行 遍历 的 结果 都 不 成 功 为 止 。 











还 有 一 个 策略 是 采用 并 行 的 方式 模拟 所 有 可 能 : 每 当 机 器 有 超过 一 条 规则 可 以 遵守 时 就 创 
建新 线程 ， 并 把 需要 模拟 的 NFA 复制 过 去 以 便 复制 的 每 一 份 都 能 尝试 一 条 新 规则 ， 然 后 
观察 它 的 结果 。 所 有 这 些 线程 都 能 同时 执行 ， 每 个 都 从 它 自己 的 输入 字符 串 副 本 中 读 取 。 
如 果 任 何 一 个 线程 让 机 器 读 取 了 整个 字符 串 ， 并 且 停 止 于 一 个 接受 状态 ， 那 么 可 以 说 这 个 
字符 串 已 经 被 接受 了 。 

这 两 个 实现 都 是 可 行 的 ， 但 是 有 些 复杂 和 低 效 。 我 们 模拟 的 DFA 非常 简单 ， 而 且 能 读 取 
单个 字符 并 报告 这 台 机 器 是 否 处 于 一 个 接受 状态 ， 因 此 要 是 能 模拟 一 台 有 同样 简单 和 透明 
的 NFA 就 好 了 。 
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幸运 的 是 ， 存 在 一 个 简单 的 方式 模拟 NFA， 而 无 需 回 退 进 程 、 创 建 线程 或 者 预先 知道 所 有 
的 输入 字符 。 事 实 上 ， 就 像 通过 跟踪 一 台 DFA 的 当前 状态 来 模拟 它 一 样 ， 我 们 可 以 通过 
跟踪 一 台 NFA 当前 所 有 可 能 的 状态 模拟 一 台 简 单 的 NFA。 这 样 比 模拟 要 转移 到 不 同方 向 
的 多 份 NFA 更 简单 更 高 效 ， 且 最 终 能 完成 同样 的 事情 。 之 前 ， 如 果 我 们 模拟 很 多 份 独立 
的 机 器 ， 那 么 只 需要 注意 它们 每 一 个 都 处 于 什么 状态 ， 但 处 于 同样 状态 的 机 器 是 完全 无 法 
分 辩 的 -， 因 此 我 们 把 所 有 可 能 都 压缩 到 一 台 机 器 上 并 询问 “到 现在 为 止 它 可 能 处 于 什么 
状态 ”， 这 样 就 不 会 失去 任何 东西 了 。 


举 个 例子 ， 让 我 们 演练 一 下 在 读 取 字 符 串 “bap' 时 示例 NFA 会 发 生 什么 。 
































在 NFA 读 取 任何 输入 之 前 ， 它 肯定 处 于 起 始 状 态 ， 也 就 是 状态 1。 

读 取 第 一 个 字符 b。 在 状态 1， 有 一 个 b 的 规则 可 以 让 NFA 停留 在 状态 1， 并 且 还 有 一 
个 b 的 规则 可 以 把 它 转移 到 状态 2， 这 样 我 们 知道 之 后 它 可 能 处 于 状态 1 或 者 状态 2。 
这 些 都 不 是 接受 状态 ， 这 表明 NFA 不 可 能 通过 读 字 符 串 'b' 到 达 一 个 接受 状态 。 

读 取 第 二 个 字符 a。 如 果 它 处 于 状态 1， 那 么 只 有 一 个 a 的 规则 可 以 用 ， 这 让 它 继续 处 
于 状态 1， 如果 它 处 于 状态 2， 就 只 能 按照 a 的 规则 转移 到 状态 3。 它 一 定 会 终止 于 状 
态 1 或 者 状态 3 ,而 这 些 又 都 不 是 接受 状态 ,因此 设 有 方法 让 字符 串 "ba ' 被 这 台 机 器 接受 。 
读 取 第 三 个 字符 b。 如 果 它 处 于 状态 1， 那 么 就 像 以 前 一 样 ， 继 续 处 于 状态 1 或 者 转移 
到 状态 2， 如 果 它 处 于 状态 3， 那 就 一 定 会 转移 到 状态 4。 

现在 我 们 知道 NFA 在 读 取 整 个 输入 字符 串 之 后 可 能 处 于 状态 1、 状 态 2 或 者 状态 4。 状 
态 4 是 一 个 接受 状态 ， 并 且 我 们 的 模拟 表明 一 定 有 某 种 方式 让 机 器 通过 读 取 那 个 字符 串 
到 达 状 态 4， 因 此 这 个 NFA 确实 能 接受 'bab'。 









































这 个 模拟 策略 很 容易 转换 成 代码 。 首 先 ， 我 们 需要 一 个 适合 存储 NFA 规则 的 规则 手册 。 
当 我 们 询问 DFA 规则 手册 处 于 特定 状态 的 DFA 读 到 一 个 特定 的 字符 之 后 下 一 步 应 该 转 
移 到 何 处 时 ， 它 总 会 返回 一 个 状态 。 但 是 ，NFA 规则 手册 需要 回答 一 个 不 同 的 问题 : 在 
NFA 处 于 几 种 可 能 状态 之 一 时 ， 它 读 取 到 一 个 特定 的 字符 ， 可 能 的 下 一 个 状态 是 什么 呢 ? 
实现 如 下 : 











require "Set 


class NFARulebook < Struct.new(:rules) 
def next states(states, character) 
states.flat map { |state| follow rules for(state, character) }.to set 
end 


def follow rules for(state, character) 
rules for(state, character).map(&:follow) 
end 























注 2: 一 台 有 限 自动 机 不 记录 自己 的 历史 ,除了 它 的 当前 状态 也 不 做 任何 存储 ， 因 此 处 于 同样 状态 的 两 台 相 





同 的 机 器 不 管 出 于 什么 目的 都 是 可 以 互 换 的 。 
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def rules for(state, character) 
rules.select { |rule| rule.applies to?(state, character) } 
end 


end 








为 了 存储 由 #next_states 返回 的 可 能 状态 ， 我 们 使 用 Ruby 标准 库 中 的 Set 
类 。 我 们 本 来 可 以 使 用 Array 类 ， 但 是 Set 类 有 三 个 有 用 的 特性 。 














(1) 它 自动 去 除 重复 元 素 。Set[1,2,2,3,3,3] 与 Set[1,2,3] 等 价 。 

(2) 它 不 关心 元 素 的 顺序 。Set[3,2,1] 与 Set[1,2,3] 等 价 。 

(3) 它 提供 标准 的 集合 操作 ， 比 如 交集 ( 卸 )、 并 集 ( 提 ) 以 及 子 集 测试 
(#subset? ) 。 




















第 一 个 特性 很 有 用 ， 因 为 “这 台 NFA 处 于 状态 3 或 者 状态 3” 这 人 句 话 是 讲 不 
通 的 ， 而 且 返 回 一 个 Set 色 ne 重复 数据 。 其 他 两 个 特性 
的 益处 将 在 稍 后 显现 。 








我 们 可 以 创建 一 个 非 确 定性 的 规则 手册 并 向 它 提问 : 


>> rulebook = NFARulebook.new([ 
FARule.new(1, 'a', 1), FARule.new(1, 'b', 1), FARule.new(1, 'b', 2), 
FARule.new(2, 'a', 3), FARule.new(2, 'b', 3), 
FARule.new(3, 'a', 4), FARule.new(3, 'b', 4) 

]) 

=> #<struct NFARulebook rules=[...]> 

>> rulebook.next states(Set[1], 'b') 

sy HeSet: {Ls 2 

>> rulebook.next states(Set[1, 2], 'a') 

=> #<Set: {1, 3}> 

>> rulebook.next states(Set[1, 3], 'b') 

=> #<Set: {1, 2, 4}> 


下 一 步 就 是 实现 一 个 NFA 类 来 表示 这 台 模 拟 的 机 器 


class NFA < Struct.new(:current states, :accept states, :rulebook) 
def accepting? 
(current states & accept states).any? 
end 


end 


方法 NFA#accepting? 通过 检查 是 否 在 current_states 和 accept_states 的 交 
。 集 里 存在 任何 状态 来 完成 自己 的 工作 一 一 也 就 是 说 ， 检 查 当 前 的 可 能 状态 是 
…” 否 也 是 一 个 接受 状态 。 























这 个 NFA 类 与 我 们 之 前 的 DFA 类 非常 相似 。 不 同 的 是 ， 它 有 一 个 当前 可 能 的 状态 集合 
current_states 而 不 是 只 有 一 个 当前 的 确定 状态 current_state， 因 此 如 果 current states 
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里 有 一 个 是 接受 状态 ， 就 说 它 处 于 接受 状态 : 


>> NFA.new(Set[1], [4], rulebook).accepting? 

=> false 

>> NFA.new(Set[1, 2, 4], [4], rulebook).accepting? 
=> true 


就 像 DFA 类 一 样 ， 我 们 可 以 实现 一 个 #7ead_character 方法 读 取 输入 中 的 一 个 字符 ， 以 及 
一 个 #read_string 方法 可 以 按 顺 序 读 取 几 个 字符 : 


class NFA 
def read character(character) 
self.current states = rulebook.next states(current states, character) 
end 


def read string(string) 
string.chars.each do |character| 
read character(character) 
end 
end 
end 





这 些 方法 实际 上 与 它们 对 应 的 DFA 几 乎 完全 相同 ， 只 是 在 机 ead_character 中 使 用 了 


current_states 和 next_ states， 而 不 是 current_state 和 next_state。 





> 














困难 的 工作 结束 了 。 现 在 我 们 可 以 启动 一 个 模拟 的 NFA， 给 它 传 人 字符 ， 并 且 询 问 它 目前 
的 输入 是 否 已 经 被 接受 : 








>> nfa = NFA.new(Set[1], [4], rulebook); nfa.accepting? 
=> false 

>> nfa.read character('b'); nfa.accepting? 

=> false 

>> nfa.read character('a'); nfa.accepting? 

=> false 

>> nfa.read character('b'); nfa.accepting? 

=> true 

>> nfa = NFA.new(Set[1], [4], rulebook) 

=> #<struct NFA current states=#<Set: {1}>, accept states=[4], rulebook=...> 
>> nfa.accepting? 

=> false 

>> nfa.read_ string('bbbbb'); nfa.accepting? 

=> true 





就 像 我 们 在 使 用 DFA 类 时 看 到 的 那样 ， 可 以 很 方便 地 使 用 一 个 NFADesign 对 象 根据 需要 自 
动 生产 新 的 NFA 实例 ， 而 不 是 手工 创建 它们 ; 











class NFADesign < Struct.new(:start state, :accept states, :rulebook) 
def accepts?(string) 
to nfa.tap { |nfa| nfa.read string(string) }.accepting? 
end 





def to nfa 
NFA.new(Set[start state], accept states, rulebook) 
end 
end 





这 让 同一 台 NFA 检查 不 同 的 字符 串 更 容易 : 


>> nfa_design = NFADesign.new(1, [4], rulebook) 

=> #<struct NFADesign start state=1, accept states=[4], rulebook=...> 
>> nfa design.accepts?('bab') 

=> true 

>> nfa_design.accepts?('bbbbb') 

=> true 

>> nfa_design.accepts?('bbabb') 

=> false 


就 是 这 样 了 。 我 们 已 经 通过 模拟 一 台 非 同 寻常 的 非 确定 性 机 器 的 所 有 可 能 执行 ， 并 构建 了 
它 的 一 个 简单 实现 。 非 确定 性 是 一 个 设计 更 复杂 有 限 自 动机 的 非常 方便 的 工具 ， 因 此 我 们 
很 地 运 能 把 NFA 投入 实际 使 用 而 不 只 是 把 它 作为 理论 中 的 珍品 。 























3.2.2 自由 移动 (free move) 
我 们 已 经 看 到 ， 对 确定 性 约束 的 放松 带 来 了 设计 机 器 的 新 方式 ， 我 们 不 再 需要 辜 精 竭力 地 
去 实现 它们 了 。 为 了 得 到 更 多 的 设计 自由 ， 我 们 还 可 以 安全 地 放松 哪些 约束 呢 ? 


很 容易 设计 一 台 DFA， 能 接受 长 度 是 2 的 倍数 的 、 由 字符 a 组 成 的 字符 串 〈 "aa 、 aaaa ……) : 


一 你 .车 


但 是 如 何 设 计 一 台 机 器 ， 让 它 能 接受 长 度 是 2 或 3 的 倍数 的 字符 串 呢 ? 我 们 知道 非 确定 性 
让 一 台 机 器 可 以 走 多 于 一 条 的 执行 路 径 ， 因 此 或 许可 以 设计 一 台 NFA， 它 有 一 条 “2 的 倍 
数 ” 的 路 径 和 一 条 “3 的 倍数 ”的 路 径 。 一 个 初步 的 尝试 可 能 看 起 来 像 这 个 样子 : 
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这 台 NFA 的 思想 是 ， 在 状态 1 和 状态 2 之 间 移 动 以 接受 像 aa 和 'aaaa 这样 的 字符 串 ， 
在 状态 1、 状态 3 和 状态 4 之 间 移 动 以 接受 像 'aaa' 和 'aaaaaaaaa' 这样 的 字符 串 。 这 工 
作 得 很 好 ， 但 问题 是 这 人 台 机 器 还 会 接受 字符 串 “aaaaa ， 因 为 它 可 以 从 状态 1 转移 到 状态 2 
然后 读 完 前 两 个 字符 的 时 候 回 到 状态 1， 再 在 状态 3 和 状态 4 之 间 转 移 ， 之 后 在 读 完 接 下 
来 的 三 个 字符 之 后 回 到 状态 1， 终 止 于 一 个 接受 状态 ， 即 使 这 个 字符 串 的 长 度 不 是 2 或 者 
3 的 倍数 。” 





























这 次 , 一 台 NFA 是 否 能 完成 这 个 工作 还 不 是 很 明显 ， 但 是 我 们 可 以 引入 一 个 叫 作 自由 移 
动 的 机 器 特性 来 解决 此 问题 。 这 些 规则 让 机 器 无 需 读 取 任何 输入 就 能 自发 遵照 执行 ， 并且 
它们 在 这 儿 提 供 帮助 是 因为 能 让 NFA 在 两 组 状态 之 间 做 一 个 初步 选择 : 














自由 移动 表示 成 从 状态 1 到 状态 2 和 状态 4 的 无 标记 虚线 箭头 。 机 器 仍然 接受 字符 串 
"aaaa' ， 它 会 先 自发 地 转移 到 状态 2， 然 后 随 着 读 取 输入 在 状态 2 和 状态 3 之 间 转 移 。 类 
似 地 ， 如 果 它 开始 先 自由 移动 到 状态 4 也 能 接受 “aaaaaaaaa 。 但 是 现在 它 没 法 接受 字符 
串 'aaaaa' 了 : 不管 做 任何 可 能 的 执行 ， 它 都 一 定 要 从 到 状态 2 或 者 状态 4 的 转移 开始 ， 
而 且 一 旦 选择 了 其 中 一 条 路 径 转移 之 后 ， 就 没 法 退回 来 了 。 一 旦 处 于 状态 2， 就 只 能 接受 
一 个 长 度 是 2 的 倍数 的 字符 串 ， 同 样 一 旦 处 于 状态 4， 就 只 能 接受 长 度 是 3 的 倍数 的 字 
符 串 。 


如 何 用 Ruby 模拟 NFA 中 的 自由 移动 呢 ? 当然 ， 是 保持 在 状态 1、 自 发 地 转移 到 状态 2， 
还 是 自发 地 转移 到 状态 4， 这 些 新 选择 并 不 比 已 有 的 非 确定 性 奇怪 多 少 ， 并 且 我 们 的 实现 
能 够 用 类 似 的 方式 处 理 它 。 我 们 已 经 有 了 一 台 模 拟 机 一 次 可 以 有 多 个 可 能 状态 的 思想 ， 因 
此 只 需要 拓展 那些 可 能 的 状态 ， 把 通过 执行 一 次 或 者 多 次 自由 移动 能 到 达 的 状态 包括 进 




















注 3: 实际 上 ， 这 台 NFA 接受 字符 a 组 成 的 任何 字符 串 ， 但 只 有 一 个 字符 的 字符 串 “a' 除外。 
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来 。 在 这 种 情况 下 ,“ 机 器 从 状态 1 开始 ”的 真正 意思 是 : 在 没有 读 取 任何 输入 之 前 ， 它 
可 能 处 于 状态 1、2 或 4。 





首先 ， 我们 需要 一 种 用 Ruby 表示 自由 移动 的 方法 。 最 简单 的 方法 就 是 使 用 正常 的 FARule 
实例 ， 只 是 在 一 个 字符 的 位 置 上 填 上 一 个 nil。NFARulebook 的 现 有 实现 将 像 处 理 其 他 任何 
字符 一 样 处 理 nil1， 因 此 我 们 可 以 询问 :“ 从 状态 1， 通 过 执行 一 次 自由 移动 (而 不 是 问 : 
“通过 读 入 一 个 字符 a ?”)， 能 到 达 什 么 状态 ?” 















































>> rulebook = NFARulebook.new([ 
FARule.new(1, nil, 2), FARule.new(1, nil, 4), 
FARule.new(2，'a'， 
FARule.new(3, 'a', 
FARule.new(4, 'a', 5), 
FARule.new(5, 'a', 
FARule.new(6, 'a', 
]) 
=> #<struct NFARulebook rules=[...]> 
>> rulebook.next states(Set[1], nil) 
=> #<Set: {2, 4}> 


下 一 步 需 要 一 些 辅助 代码 帮助 找到 从 一 个 特定 集合 的 状态 开始 ， 通 过 自由 移动 所 能 到 达 的 


所 有 状态 。 这 些 代 码 只 能 反复 自由 移动 ， 因 为 只 要 存在 从 当前 状态 出 发 的 自由 移动 ， 一 
NFA 就 可 以 多 次 自发 改变 状态 。 可 以 把 它 很 方便 地 放 到 NFARulebook 类 的 一 个 方法 里 : 

















class NFARulebook 
def follow free moves(states) 
more states = next states(states, nil) 


if more states.subset?(states) 
states 
else 
follow free moves(states + more states) 
end 
end 
end 


NFARulebook#follow_free_moves 以 递归 的 方式 查找 越 来 越 多 的 状态 ， 这 些 状 态 能 从 一 个 给 
定 的 集合 通过 自由 移动 到 达 。 再 也 找 不 到 时 ， 即 由 next_states(states,nil) 找到 的 每 一 个 
状态 都 已 经 包含 在 states 里 时 ， 它 就 返回 找到 的 所 有 状态 。 











以 下 代码 正确 地 识别 出 NFA 在 读 取 任 何 输 入 之 前 的 可 能 状态 : 








>> rulebook.follow free moves(Set[1]) 
=> #<Set: {1, 2, 4}> 


现在 通过 覆盖 NFA#current_states 已 有 的 实现 (就 像 履 盖 Struct 提供 的 方法 一 样 )， 我 们 














注 4: 确切 地 说 ， 这 个 过 程 计 算 了 “通过 自由 移动 增加 更 多 状态 ”函数 的 定点 。 
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把 对 自由 移动 的 支持 加 入 到 NFA 当中 。 新 的 实现 将 与 NFARulebook#follow_free_moves 挂 
钩 ， 并 确保 自动 机 当前 可 能 的 状态 总 是 包含 通过 自由 移动 能 到 达 的 任何 状态 : 





class NFA 
def current states 
rulebook.follow free moves(super) 
end 
end 


因为 其 他 所 有 NFA 方法 都 是 通过 调用 #current_states 访问 当前 可 能 状态 的 集合 ， 所 以 这 
种 透明 性 让 我 们 不 必 改 动 NFA 代码 的 其 他 部 分 就 能 支持 自由 移动 。 

这 就 全 部 完成 了 。 现 在 模拟 支持 自由 移动 了 ， 而 且 现在 能 看 看 哪些 字符 串 能 被 我 们 的 NFA 
接受 了 : 











>> nfa design = NFADesign.new(1, [2, 4], rulebook) 


=> #<struct NFADesign ...> 

>> nfa design.accepts?('aa') 

=> true 

>> nfa_ design.accepts?('aaa') 

=> true 

>> nfa design.accepts?('aaaaa') 
=> false 

>> nfa design.accepts?('aaaaaa') 
=> true 





自由 移动 实现 起 来 非常 简单 ， 并 且 在 非 确 定性 的 基础 之 上 给 了 我 们 额外 的 设计 自由 。 





本 章 中 有 一 些 非 传统 术语 。 有 限 自动 机 读 取 的 字符 通常 叫 作 符号 (symbol) ， 
心 状态 之 间 移 动 的 规则 叫 作 转移 (transition)， 组 成 一 台 机 器 的 规则 集合 叫 作 转 
司 ” 多 函数 (有 了 时候 也 叫 NFA 的 转移 关系 ) 而 不 是 规则 手册 。 因 为 表示 空 字符 
串 的 数学 符号 是 希腊 字母  ， 能 自由 移动 的 NFA 称 为 NFA- s ， 自 由 移动 本 

身 通常 称 为 6 转移 。 




















3.3 正则 表达 式 


我 们 已 经 看 到 非 确定 性 和 自由 移动 增强 了 有 限 自 动机 的 表达 能 力 ， 而 且 不 会 干扰 我 们 对 有 限 
自动 机 的 模拟 。 在 这 一 节 ， 我 们 将 会 看 到 这 些 特性 一 个 重要 的 实际 应 用 : 正则 表达 式 匹 配 。 
正则 表达 式 提供 了 书写 模式 的 语言 ， 字 符 串 可 以 按照 这 个 模式 进行 匹配 。 下 面 是 一 些 正 则 
表达 式 的 例子 。 





。 hello， 只 能 匹配 字符 串 'hello'。 
。 hello|goodbye， 能 匹配 字符 串 ' hello， 和 “ “goodbye ' 。 
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。 (hello)* ,匹配 字符 串 'hello'、'hellohello'、'hellohellohello' 等 ,也 与 空 字符 串 匹 配 。 








在 这 一 章 里 ， 我 们 把 正则 表达 式 看 成 是 与 整个 字符 囊 进 行 匹配 。 真 实 世界 中 
一 CB 的 正则 表达 式 实现 通常 与 部 分 字符 串 匹 配 ， 如 果 要 求 与 整个 字符 串 匹 配 的 
话 ， 则 应 该 使 用 额外 的 语法 。 



































例如 ， 我 们 的 正则 表达 式 hellolgoodpye 在 Ruby 中 应 该 写成 八 Alhello| 
goodbye)\z/， 这 确保 任何 匹配 都 固定 在 字符 串 的 开始 (\A) 和 结尾 〈\z) 之 间 。 





给 定 一 个 正则 表达 式 和 一 个 字符 串 ， 我 们 如 何 写 程序 决定 这 个 字符 串 是 否 与 那个 表达 式 匹 
配 呢 ? 大 多 数 的 编程 语言 ， 包 括 Ruby 在 内 ， 已 经 内 建 了 对 正则 表达 式 的 支持 ， 但 是 这 样 
的 支持 是 如 何 工作 的 呢 ? 如 果 语 言 没 有 支持 正则 表达 式 ， 我们 如 何 使 用 Ruby 实现 它们 呢 ? 


有 限 自 动机 完全 适合 这 个 工作 。 就 像 我 们 即将 看 到 的 ， 把 任何 正则 表达 式 转 成 一 个 等 价 
的 NFA 是 可 能 的 一 一 每 一 个 与 正则 表达 式 匹配 的 字符 串 都 能 被 这 人 台 NFA 接受 ， 反 过 来 
也 一 样 一 一 把 字符 串 输 入 给 一 台 模 拟 的 NFA 看 它 是 否 能 被 接受 ， 从 而 判断 字符 串 是 否 与 
正则 表达 式 匹 配 。 用 第 2 章 的 话说 ， 我 们 可 以 把 这 个 看 成 是 为 正则 表达 式 提 供 了 一 种 指称 
语义 : 我 们 不 一 定 知道 如 何 直 接 执行 一 个 正则 表达 式 ， 但 是 可 以 展示 如 何 把 它 表示 成 一 台 
NFA， 并 且 因 为 有 了 NFA 的 操作 语义 (“通过 读 取 字符 然后 执行 规则 改变 状态 ”)， 所 以 可 
以 执行 这 个 指称 (denotation) 实现 同样 的 结果 。 












































3.3.1 语法 
让 我 们 明确 一 下 “正则 表达 式 ” 是 什么 意思 。 下 面 是 两 种 极其 简单 的 正则 表达 式 ， 它 们 已 
经 没 法 更 简单 了 。 


























。 一 个 空 的 正则 表达 式 。 与 空 字符 匹配 ， 没 有 别 的 可 匹配 的 了 。 
。 一 个 只 含有 一 个 字符 的 正则 表达 式 。 例 如 ，a 和 "是 分 别 只 能 匹配 3 和 'b' 的 正则 表 
达 式 。 





有 了 这 几 种 简单 的 模式 之 后 ， 我 们 有 三 种 方式 可 以 把 它们 结合 起 来 构造 更 复杂 的 表达 式 。 


。 连接 两 个 模式 。 我 们 可 以 把 正则 表达 式 3 和 b 连接 起 来 得 到 正则 表达 式 ab， 它 只 与 字 
符 串 'ab' 匹配 。 

。 在 两 个 模式 之 间 选 择 ， 使 用 运算 符 | 把 它们 联结 起 来 。 我 们 可 以 把 正则 表达 式 a 或 b 联 
结 在 一 起 得 到 alb， 它 与 字符 串 'a" 和 “5 匹配 。 

。 重复 一 个 模式 零 次 或 者 多 次 ， 写 法 是 加 上 运算 符 * 作为 后 级 。 我 们 可 以 给 正则 表达 式 .a 
加 上 后 级 得 到 a*, 它 与 字符 串 'a' 、'aa' 、'aaa' 等 匹配 ,当然 也 与 空 字符 串 “ 匹配 (也 
就 是 说 重复 零 次 )。 
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现实 中 的 正则 表达 式 引擎 (比如 构建 到 Ruby 当中 的 )， 支 持 更 多 的 特性 。 为 
4。 了 简单 起 见 ， 我 们 不 会 尝试 实现 这 些 额外 的 特性 ， 它 们 中 有 很 多 从 学 术 上 讲 
必 ， 多 余 ， 只 是 为 了 方便 才 提 供 的 。 

















例如 ， 省 略 运算 符 ”和 + 没有 什么 太 大 区 别 ， 因 为 它们 的 作用 (分 别 为 “ 重 
复 一 或 者 零 次 ”和 “重复 一 或 者 多 次 ") 很 容易 使 用 已 有 的 特性 实现 : 正则 
表达 式 ap? 可 以 重 写成 apla， 而 模式 ab+ 与 abb* 匹配 同样 的 字符 串 。 基 他 
计数 重复 (如 a{2,5}) 和 字符 组 (如 [abc]) 等 方便 的 特性 也 是 这 样 。 
































捕获 组 (capture group)、 反 向 引用 (backreference) 以 及 先行 /后 行 断言 
(lookahead/lookbehind assertion) 这 样 的 高 级 特性 已 经 超出 了 本 章 的 讲述 范围 。 











为 了 使 用 Ruby 实现 这 个 语法 ， 我 们 可 以 为 每 类 正则 表达 式 定 义 一 个 类 ， 并 使 用 这 些 类 的 
实例 表示 任何 正则 表达 式 的 抽象 语法 树 ， 就 像 在 第 2 章 里 处 理 Simple 表达 式 一 样 : 

















module Pattern 
def bracket(outer precedence) 
if precedence < outer precedence 
'("+tos+') 
else 
to s 
end 
end 


def inspect 
"/#{self}/" 
end 
end 


class Empty 
include Pattern 


def to s 

end 

def precedence 
3 

end 


end 


class Literal < Struct.new(:character) 
include Pattern 


def to s 
character 


end 


def precedence 


[SU] 





end 
end 


class Concatenate < Struct.new(:first, :second) 
include Pattern 


def to s 
[first, second].map { |pattern| pattern.bracket(precedence) }.join 
end 


def precedence 
1 
end 
end 


class Choose < Struct.new(:first, :second) 
include Pattern 


def to s 
[first, second].map { |pattern| pattern.bracket(precedence) }.join('|') 
end 


def precedence 
0 
end 
end 


class Repeat < Struct.new(:pattern) 
include Pattern 


def to s 
pattern.bracket(precedence) + '*"' 
end 


def precedence 
2 
end 
end 


在 算术 表达 式 中 乘法 对 它 参 数 的 绑 定 比 加 法 要 更 紧 (1+2 x 3 等 于 7， 而 不 是 
9)， 同 样 ， 这 个 约定 也 适用 于 正则 表达 式 的 语法 ， 它 的 * 运算 符 也 比 串联 运 
， 算 符 绑 定 得 更 紧 ， 而 串联 运算 符 又 比 | 运算 符 绑 定 得 紧 。 例 如 ， 在 正则 表达 
式 abc* 中 , * 只 会 应 用 到 c 上 ('abc'、'abcc'、'abcce ee )， 而 为 了 让 它 
能 应 用 到 整个 abc 上 ('abc'、'abcabc' ) ， 需 要 加 上 括号 写成 (abc)*。 














语法 类 的 实现 失 o_s 和 Pattern#bracket 方法 一 起 ， 会 在 必要 的 时 候 自 动 插 
和 括号， 这样 在 查看 一 棵 抽象 语法 树 的 简单 字符 串 表 示 时 ， 我 们 也 能 知道 它 
的 结构 信息 。 


有 了 这 些 类 ， 我 们 就 可 以 手工 构建 表示 正则 表达 式 的 树 ; 






































最 简单 的 计算 机 | 77 


>> pattern = 
Repeat.new( 
Choose.new( 
Concatenate.new(Literal.new('a'), Literal.new('b')), 
Literal.new('a') 
) 
) 
=> /(abla)*/ 
当然 ， 在 实际 的 实现 中 ， 我 们 不 会 手工 构建 这 些 树 ， 而 会 使 用 语法 解析 器 构建 它们 ， 可 以 
参考 3.3.3 节 。 


3.3.2 语义 


既然 我 们 可 以 把 正则 表达 式 语法 表示 成 Ruby 对 象 组 成 的 树 ， 那 么 如 何 把 这 个 语法 转换 成 
NFA 呢 ? 


我 们 需要 知道 每 个 语法 类 的 实例 应 该 如 何 转换 成 NFA。 转 换 起 来 最 简单 的 类 是 Empty， 应 
该 总 是 把 它 转 换 成 一 个 状态 的 NFA， 这 个 NFA 只 接受 空 字符 串 : 


一 人 


类 似 地 ， 我 们 应 该 把 任何 单字 符 的 模式 转换 成 只 接受 包含 那个 字符 的 、 单 字符 串 的 NFA。 


下 面 是 模式 a 的 NFA: 
-© 


为 Empty 和 Literal 实现 批 o_nfa_design 方法 来 生成 这 些 NFA 相当 容易 : 





class Empty 
def to nfa design 
start state = Object.new 
accept states = [start state] 
rulebook = NFARulebook.new([]) 


NFADesign.new(start state, accept states, rulebook) 
end 
end 


class Literal 
def to nfa design 
start state = Object.new 
accept state = Object.new 
rule = FARule.new(start state, character, accept state) 
rulebook = NFARulebook.new([rule]) 
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NFADesign.new(start state, [accept state], rulebook) 
end 
end 


3.1.4 节 提 到 过 ， 用 Ruby 对 象 实现 自动 机 时 ， 状 态 对 象 彼此 之 间 一 定 要 能 区 
人 S 4 、 分 。 这 里 没有 使 用 数字 (如 Fixnum 实例 ) 作为 状态 ， 而 是 使 用 了 新 创建 的 
”object 实例 。 








这 是 为 了 每 一 个 NFA 都 能 有 它 自 己 独一无二 的 状态 ， 以 便 把 小 的 机 器 组 合 
成 大 的 机 器 ， 而 不 会 意外 把 它们 的 状态 也 进行 归并 。 例 如 ， 如 果 两 个 不 同 的 
NFA 都 使 用 Ruby 的 Fixnum 对 象 1 作为 状态 ， 在 保持 它们 两 个 状态 独立 的 
情况 下 ， 它 们 不 能 合 到 一 起 。 但 是 我 们 将 来 会 需要 能 进行 这 样 的 合并 ， 以 便 
能 实现 更 复杂 的 正则 表达 式 。 











类 似 地 ， 我 们 不 会 继续 在 图 上 为 状态 打 标 记 ， 这 样 以 后 把 图 连 到 一 起 时 也 不 
用 重新 对 其 进行 标记 。 
































可 以 检查 由 Empty 和 Literal 正则 表达 式 生成 的 NFA 能 否 接受 我 们 想 要 它 接 受 的 字符 串 : 


>> nfa design = Empty.new.to nfa design 
=> #<struct NFADesign ...> 

>> nfa design.accepts?('') 

=> true 

>> nfa design.accepts?('a') 

=> false 

>> nfa design = Literal.new('a').to nfa design 
=> #<struct NFADesign ...> 

>> nfa design.accepts?("'') 

=> false 

>> nfa design.accepts?('a') 

=> true 

>> nfa design.accepts?('b') 

=> false 


这 里 有 机 会 可 以 把 枇 o_nfa_design 封装 进 #matches? 方法 ， 让 模式 有 一 个 更 友好 的 接口 : 


module Pattern 
def matches?(string) 
to nfa design.accepts?(string) 
end 
end 





Ud 


这 样 我 们 就 可 以 直接 用 模式 匹配 字符 串 : 


>> Empty.new.matches?('a') 

=> false 

>> Literal.new('a').matches?('a') 
=> true 
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既然 我 们 知道 如 何 把 简单 的 Empty 和 Literal 正则 表达 式 转 成 NFA 了 ， 那 对 Concatenate 
串联 ) 、Choose (选择 ) 和 Repeat (重复 ) 也 需要 类 似 的 进行 转换 。 








一 、 


从 Concatenate 开始 : 如 果 有 两 个 已 经 知道 如 何 转 换 成 NFA 的 正则 表达 式 ， 那 么 如 何 构造 
一 个 NFA 表示 这 些 正 则 表达 式 的 串联 呢 ? 举 个 例子 ， 假 如 能 把 单个 字符 的 正则 表达 式 a 
和 b 转换 成 NFA， 那 怎么 把 ab 转 成 一 个 NFA 呢 ? 





对 于 ab， 我 们 可 以 把 两 个 NFA 按 顺 序 连 接 到 一 起 ， 用 自由 移动 把 它们 联结 在 一 起 ， 并 且 
保留 第 二 个 NFA 的 接受 状态 : 


—( )»O9 后 接 一 人 ()() 
节 


这 个 技术 在 其 他 情况 下 也 行 得 通 。 任 意 两 个 NFA 的 连接 ， 都 可 以 先 把 第 一 个 NFA 的 每 一 
个 接受 状态 转 成 非 接受 状态 ， 再 通过 自由 移动 把 它 与 第 二 个 NFA 的 开始 状态 连接 。 如 果 
一 串 输 入 能 让 原来 第 一 台 NFA 进入 接受 状态 ， 串 联 起 来 的 机 器 读 入 这 串 输入 之 后 就 能 自 
发 的 进入 到 原来 第 二 个 NFA 的 起 始 状 态 ， 然 后 通过 读 取 一 串 原来 第 二 个 NFA 能 接受 的 输 


入 ， 它 将 到 达 自 己 的 接受 状态 。 


OO 























全 


因此 ， 组合 机 器 的 原材料 是 : 


。 第 一 个 NFA 的 起 始 状态 ; 
。 第 二 个 NFA 的 接受 状态 ; 
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。 两 台 NFA 的 所 有 规则 ， 
。 一 些 额外 的 自由 移动 ， 可 以 把 第 一 台 NFA 旧 的 接受 状态 与 第 二 个 NFA 旧 的 起 始 状态 连 


可 以 把 


人 


en 


这 个 想法 转换 成 Concatenate#to_nfa_design 的 实现 : 


ass Concatenate 

def to nfa design 
first nfa design = first.to nfa design 
second nfa design = second.to nfa design 


start state = first nfa design.start state 

accept states = second nfa design.accept states 

rules = first nfa design.rulebook.rules + second nfa design.rulebook.rules 

extra rules = first nfa design.accept states.map { |statel 
FARule.new(state, nil, second nfa design.start state) 


rulebook = NFARulebook.new(rules + extra rules) 
NFADesign.new(start state, accept states, rulebook) 


end 
d 





这 段 代 码 首 先 把 第 一 和 第 二 个 正则 表达 式 转换 成 NFADesign， 然 后 把 它们 的 状态 和 规则 用 合 
适 的 方式 组 合 到 一 起 构成 新 的 NFADesign。ab 这 种 简单 的 情况 是 没有 问题 的 : 





pattern = Concatenate.new(Literal.new('a'), Literal.new('b')) 
/ab/ 

pattern.matches?('a') 

false 

pattern.matches?('ab') 

true 

pattern.matches?('abc') 

false 














这 个 转换 过 程 是 递归 的 (Concatenate#to _nfa_design 对 其 他 对 象 调用 其 o_nfa_design)， 


因此 对 
(a 与 b 


>> 

















联 


Hd 


于 像 abc 这 样 的 更 深 媒 套 的 正则 表达 式 也 能 正常 工作 ， 这 种 情况 下 将 包含 两 次 
串联 然后 与 < 串联 ) : 





pattern = 
Concatenate .new( 
Literal.new('a'), 
Concatenate.new(Literal.new('b'), Literal.new('c')) 
) 
/abc/ 
pattern.matches?('a') 
false 
pattern.matches?('ab') 
false 
pattern.matches?('abc') 
true 
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赚 六 


这 又 是 一 个 组 合 型 指称 语义 的 例子 : 复合 正则 表达 式 的 NFA 指称 由 它 每 一 
人 4 、 部 分 NFA 的 指称 组 成 。 


\ 
\ 


0, 


我 们 可 以 使 用 同样 的 策略 把 Choose 表达 式 转 成 一 台 NFA。 在 最 简单 的 情况 下 ， 正 则 表达 
式 a 和 b 的 NEFA 能 结合 起 来 构造 成 正则 表达 式 alb 的 NFA， 方 法 是 增加 一 个 新 的 起 始 状 
态 并 使 用 自由 移动 把 它 与 两 台 原始 机 器 之 前 的 起 始 状 态 连 接 起 来 : 


-O*O -OO 




















在 alb NFA 读 取 任 何 输入 之 前 ， 它 可 以 自由 移动 进入 任何 一 个 原始 机 器 的 起 始 状态 ， 再 从 
这 个 状态 开始 读 取 'a' 或 者 'b' 从 而 到 达 一 个 接受 状态 。 通 过 增加 一 个 新 的 起 始 状态 和 两 
个 自由 移动 ， 把 任意 两 台 机 器 连 到 一 起 很 简单 : 


-OO 











A) 
-0 





Oo 
| 
证 
(LU 
贡 





在 这 种 情况 下 ， 组 合 机 器 的 原材料 是 : 


一 个 新 的 起 始 状态 ; 

两 台 NFA 的 所 有 接受 状态 ， 

两 台 NFA 的 所 有 规则 ， 

两 个 额外 的 自由 移动 ， 可 以 把 新 的 起 始 状 态 与 NFA 旧 的 起 始 状 态 连 接 起 来 。 








实现 Choose#to_nfa_design 仍然 不 难 : 


class Choose 
def to nfa design 


first nfa design = first.to nfa design 
second nfa design = second.to nfa design 


start state = Object.new 

accept states = first nfa design.accept states + second nfa design.accept states 
rules = first nfa design.rulebook.rules + second nfa design.rulebook.rules 

extra rules = [first nfa design, second nfa design].map { |nfa design| 
FARule.new(start state, nil, nfa design.start state) 


} 


rulebook = NFARulebook.new(rules + extra rules) 


NFADesign.new(start state, accept states, rulebook) 


end 


end 


这 个 实现 很 好 : 


最 后 ， 我 们 开始 讨论 Repeat ， 如 何 把 与 一 个 字符 是 
符 串 重复 零 次 或 者 更 多 次 的 NFA 呢 ? 我 们 为 a* 构造 一 个 NFA， 其 开头 是 一 个 3 对 应 的 


pattern = Choose.new(Literal.new('a'), Literal.new('b')) 
/alb/ 

pattern.matches?('a') 

true 

pattern.matches?('b') 

true 

pattern.matches?('c') 

false 








NFA， 然 后 做 两 个 补充 : 


从 它 的 接受 状态 到 开始 状态 增加 一 个 








匹配 空 字符 串 了 。 


图 示 如 下 : 
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匹配 的 NFA， 转 换 成 能 匹配 同一 个 字 


自由 移动 ， 这 样 它 就 可 以 与 多 于 一 个 'a' 匹配 了 ， 
增加 一 个 可 自由 移动 到 旧 的 开始 状态 的 新 状态 ， 并 且 使 其 作为 接受 状态 ， 这 样 它 就 可 以 


a 
一 人 (六 (人 零 次 或 多 次 





从 旧 的 接受 状态 得 到 旧 的 起 始 状态 的 自由 移动 ， 能 让 机 器 进行 多 次 匹配 而 不 是 只 匹配 一 次 
('aa'、'aaa' 等 )， 并 且 新 的 起 始 状 态 允 许 它 匹配 空 字符 串 而 不 会 影响 它 能 接受 的 其 他 字 
符 串 ”。 对 任何 的 NFA 我 们 都 可 以 一 样 处 理 ， 只 要 通过 自由 移动 把 每 一 个 旧 的 接受 状态 和 
旧 的 起 始 状 态 连 接 起 来 即 可 : 


全 过 

















这 次 我 们 需要 : 

。 一 个 新 的 起 始 状 态 ， 它 也 是 一 个 接受 状态 ; 
。 旧 的 NFA 中 所 有 的 接受 状态 ; 

。 旧 的 NFA 中 所 有 的 规则 ; 


。 一 些 人 额外 的 自由 移动 ， 把 旧 NFA 的 每 一 个 接受 状态 与 旧 的 起 始 状 态 连接 起 来 ; 
。 男 一 些 自由 移动 ， 把 新 的 起 始 状态 与 旧 的 起 始 状态 连接 起 来 。 


让 我 们 把 这 些 转换 成 代码 : 





注 5: 在 这 种 简单 的 情况 下 ， 我 们 可 以 只 把 原始 的 起 始 状态 转 成 一 个 接受 状态 ， 而 不 增加 新 状态 。 但 是 在 更 
复杂 的 情况 下 《例如 (axb)*) ， 这 种 技术 可 能 会 产生 一 台 接受 除了 空 字符 串 外 其 他 一 些 不 想 要 字符 串 
的 机 器 。 





























84 | 第 3 章 


class Repeat 
def to nfa design 
pattern nfa design = pattern.to nfa design 


start state = Object.new 

accept states = pattern nfa design.accept states + [start state] 

rules = pattern nfa design.rulebook.rules 

extra rules = 
pattern nfa design.accept states.map { |accept statel| 

FARule.new(accept state, nil, pattern nfa design.start state) 

} + 
[FARule.new(start state, nil, pattern nfa design.start state)] 

rulebook = NFARulebook.new(rules + extra rules) 





NFADesign.new(start state, accept states, rulebook) 
end 
end 


然后 检查 结果 : 


>> pattern = Repeat.new(Literal.new('a')) 
=> /a*/ 

>> pattern.matches?('') 

=> true 

>> pattern.matches?('a') 

=> true 

>> pattern.matches?('aaaa') 

=> true 

>> pattern.matches?('b') 

=> false 


既然 每 个 正则 表达 式 语 法 类 都 已 经 有 了 黄 o_nfa_design 实现 ， 下 面 就 可 以 构建 复杂 的 模式 
并 用 它们 匹配 字符 串 了 : 


>> pattern = 
Repeat.new( 
Concatenate. new( 
Literal.new('a'), 
Choose.new(Empty.new, Literal.new('b')) 


) 


) 
=> /(a(|b))*/ 
>> pattern.matches?('') 
=> true 
>> pattern.matches?('a') 
=> true 
>> pattern.matches?('ab') 
=> true 
>> pattern.matches?('aba') 
=> true 
>> pattern.matches?('abab') 
=> true 
>> pattern.matches?('abaab') 
=> true 
>> pattern.matches?('abba') 
=> false 
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这 个 结果 很 好 。 我 们 从 模式 的 语法 开始 ， 然 后 展示 如 何 把 任意 模式 转换 成 一 台 NFA， 而 
NFA 是 我 们 已 经 知道 如 何 执行 的 抽象 机 器 ， 这 样 就 拥有 了 这 种 语法 的 语义 。 再 配 上 一 个 语 
法 解析 器 ， 我 们 就 有 了 一 种 实用 的 方法 ， 可 以 读 取 正 则 表达 式 并 决定 它 是 否 与 某 个 特定 的 
字符 串 匹 配 。 对 这 种 方法 自由 移动 非常 有 用 ， 因 为 它们 能 把 小 一 些 的 机 器 组 合成 更 大 的 机 
器 ， 并 且 不 会 影响 其 中 任何 组 成 部 分 的 行为 。 








现实 中 多 数 正则 表达 式 实 现 (如 Ruby 使 用 的 Onigmo 库 ) 的 工作 方式 都 不 

心 是 照 字面 把 模式 编译 到 有 限 自动 机 然后 模拟 它们 执行 。 尽 管 这 种 方法 在 对 字 

尼 ， 符 串 进行 正则 表达 式 匹 配 时 快 而 且 高 效 ， 但 是 在 支持 更 高 级 的 特性 ， 如 捕 
获 组 (capture groups) 和 先行 /后 行 断言 (lookahead/lookbehind assertions) 
时 ,会 困难 得 多 。 因 此 ， 大 多 数 的 库 都 使 用 某 种 回溯 算法 (backtracking 
algorithm) 更 直接 地 处 理 正则 表达 式 ， 而 不 是 把 它们 转换 成 有 限 自 动机 。 


< 


























Russ Cox 的 RE2 库 (http://code.google.com/p/re2/) 是 一 个 产品 质量 级 别 的 
C++ 正则 表达 式 实现 ， 它 不 把 模式 编译 成 自动 机 “， 而 Pat Shaughnessy 已 经 
写 了 一 篇 很 详细 的 博客 (http://patshaughnessy.net/2012/4/3/exploring-rubys- 
regular-expression-algorithm ) ， 来 探索 Ruby 正则 表达 式 如 何 工作 。 





3.3.3 解析 

我 们 几乎 构建 了 一 个 完整 的 《虽然 很 基本 ) 正则 表达 式 实现 。 唯 一 缺失 的 是 一 个 模式 
语法 的 语法 解析 器 : 如 果 我 们 只 需要 写 (a(|b))# 而 不 是 通过 Repeat.new(Concatenate. 
new(Literal.new('a')，Choose.new(Empty.new，Literal.new('b')))) 手工 地 构建 出 抽象 语 
法 树 就 方便 多 了 。 我 们 在 2.6 节 中 看 到 使 用 Treetop 生成 一 个 语法 解析 器 并 不 困难 ， 它 能 把 
原始 语法 自动 转换 成 一 个 AST (抽象 语法 树 ) ， 因 此 下 面 也 这 样 做 来 完成 我 们 的 实现 。 























下 面 是 一 个 简单 正则 表达 式 的 Treetop 语法 : 











grammar Pattern 
rule choose 


first:concatenate or empty '|' rest:choose { 

def to ast 
Choose.new(first.to ast, rest.to ast) 

end 

} 

/ 

concatenate or empty 

end 


rule concatenate or empty 
concatenate / empty 
end 





注 6: RE2 的 口号 是 “一 个 高 效 的、 条 理化 的 正则 表达 式 库 ”， 这 很 难 反 驱 。 
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rule concatenate 
first:repeat rest:concatenate { 
def to ast 
Concatenate.new(first.to ast, rest.to ast) 
end 
} 
/ 
repeat 
end 


rule empty 
1 { 
def to ast 
Empty.new 
end 
} 


end 


rule repeat 
brackets '*' { 
def to ast 
Repeat .new(brackets. to ast) 
end 
} 
/ 
brackets 
end 


rule brackets 
'(' choose ')' { 
def to ast 
choose.to ast 
end 
} 
/ 
literal 
end 


rule literal 
[a-z] { 
def to ast 
Literal.new(text value) 
end 


规则 的 顺序 又 一 次 反映 了 每 一 个 运算 符 的 优先 级 : 运算 符 的 优先 级 从 上 到 下 越 
。 来 越 高 ，| 运算 符 的 绑 定 最 宽松 ， 因 此 choose 规则 在 最 前 面 。 














现在 我 们 分 析 一 个 正则 表达 式 ， 把 它 转 换 成 一 个 抽象 语法 树 ， 并 使 用 它 匹 配 字符 串 所 需 
的 条 件 已 经 全 部 俱 
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>> require 'treetop' 

=> true 

>> Treetop.10ad('pattern') 

=> Patternparser 

>> parse tree = Patternparser.new.parse(' (a(|b))*') 

=> SyntaxNode+Repeat1+Repeat0 offset=0, "(a(|b))*" (to ast,brackets): 
SyntaxNode+BTackets1+BTackets0 offset=0, "(a(|b))" (to ast,choose): 

SyntaxNode offset=0, "(" 

SyntaxNode+Concatenate1+Concatenate0 offset=1, "a(|b)" (to ast,first,rest): 
SyntaxNode+Literal0 offset=1, "a" (to ast) 
SyntaxNode+BTackets1+BTackets0 offset=2, "(|b)" (to ast,choose): 

SyntaxNode offset=2, "(" 
SyntaxNode+Choose1+Choose0 offset=3, "|b" (to ast,first,rest): 
SyntaxNode+Empty0 offset=3, "" (to ast) 
SyntaxNode offset=3, "|" 
SyntaxNode+Literal0 offset=4, "b" (to ast) 
SyntaxNode offset=5, ")" 
SyntaxNode offset=6, ")" 
SyntaxNode offset=7, "*" 
>> pattern = parse tree.to ast 
=> /(a(|b))*/ 
>> pattern.matches?('abaab') 
=> true 
>> pattern.matches?('abba') 
=> false 


3.4 等 价 性 


本 章 已 经 描述 了 确定 性 状态 机 的 思想 ， 并 且 为 它 增 加 了 更 多 特性 。 首 先是 非 确定 性 ， 在 设 
计 机 器 时 它 能 提供 很 多 可 能 的 执行 路 径 。 还 有 自由 移动 ， 它 让 非 确 定性 的 机 器 无 需 读 取 任 
何 输入 就 可 以 改变 状态 。 

非 确 定性 和 自由 移动 让 设计 有 限 状 态 机 执行 特定 的 工作 更 容易 一 一 我 们 已 经 看 到 它们 在 把 正 
则 表达 式 转 换 成 状态 机 时 非常 有 用 一 一 但 它们 为 我 们 做 了 什么 标准 DFA 不 能 做 的 事情 吗 ? 


把 任何 非 确 定性 有 限 自 动机 转 成 接受 完全 相同 字符 串 的 确定 性 自动 机 是 可 能 的 。 考 虑 到 一 
台 DFA 的 额外 约束 ， 这 可 能 有 些 令 人 吃惊 。 但 在 思考 一 下 我 们 对 两 种 机 器 执行 的 模拟 方 
式 之 后 ， 这 就 能 讲 得 通 了 。 

假如 我 们 要 模拟 一 台 特 定 DFA 的 行为 。 对 这 个 假想 DFA 读 取 一 个 特定 字符 序列 的 模拟 可 


能 会 是 这 样 : 




















。 机 器 读 取 任何 输入 之 前 ， 它 处 于 状态 1; 

。 机 器 读 取 字符 'a' ， 那 么 它 现在 处 于 状态 2; 

。 机 器 读 取 字 符 “b ， 那 么 它 现在 处 于 状态 3， 

。 不 再 有 输入 ， 而 且 状态 3 是 一 个 接受 状态 ， 所 以 字符 串 'ab' 已 经 被 接受 。 








这 里 有 一 些 很 微妙 的 东西 : 模拟 在 重新 创造 着 DFA 的 行为 。 在 我 们 的 例子 里 ， 模 拟 是 运行 
在 一 ee 
在 。 每 当 假想 的 DFA 改变 状态 的 时 候 ， 正 在 运 因此 才 称 其 为 模拟 。 


很 难 把 DFA 和 它 的 模拟 分 开 ， 因 为 它们 都 是 确定 性 的 ， 而 且 它 们 的 状态 完全 匹配 : DFA 
处 于 状态 2 的 时 候 ， 模 拟 也 处 于 一 个 能 表明 “这 台 DFA 处 于 状态 2” 的 状态 。 在 我 们 的 
Ruby 模拟 中 ， 这 个 模拟 状态 实际 上 就 是 DFA 实例 的 current_state 属性 值 。 






































尽管 在 处 理 非 确定 性 和 自动 移动 时 有 额外 的 开销 ， 但 对 一 个 假想 的 NFA 读 取 字 符 串 进行 
模拟 并 没有 什么 大 的 不 同 。 


。 机 器 读 取 任何 输入 之 前 ， 它 可 能 处 于 状态 1 或 者 状态 3。 

。 机 器 读 取 字 符 c， 那 么 现在 它 可 能 处 于 状态 1、3 或 者 4 中 的 一 个 。 

。 机 器 读 取 字 符 d， 那 么 现在 它 可 能 处 于 状态 2 或 者 状态 5 中 的 一 个 。 

。 不 再 有 输入 ， 并 且 状 态 5 是 一 个 接受 状态 ， 因 此 字符 串 “cd ' 已 经 被 接受 。 


模拟 的 状态 与 NFA 的 状态 不 一 样 ， 这 一 点 此 时 更 容易 看 出 来 。 事 实 上 ， 在 模拟 的 每 一 点 
上 ， 我 们 一 直 都 无 法 确定 NFA 那 时 处 于 什么 状态 。 但 是 模拟 本 身 仍然 是 确定 性 的 ， 因 为 
它 的 状态 能 够 适应 这 种 不 确定 性 。 在 NFA 可 能 处 于 状态 1、3 或 者 4 中 一 个 的 时 候 ， 我 们 
可 以 肯定 模拟 现在 处 于 一 个 表示 “NFA 处 于 状态 1、3 或 者 4” 的 某 一 个 确定 状态 。 


这 两 个 例子 的 唯一 真正 区 别 是 ，DFA 的 模拟 是 从 一 个 当前 状态 移动 到 另 一 个 ， 而 NEFA 的 
模拟 是 从 一 个 当前 可 能 状态 的 集合 移动 到 另 一 个 可 能 状态 的 集合 。 尽 管 一 个 NEFA 的 规则 
手册 可 以 是 非 确定 性 的 ， 但 是 对 于 一 个 给 定 的 输入 从 当前 状态 出 发 移动 到 哪些 状态 ， 这 个 
决定 总 是 完全 确定 性 的 。 


这 种 确定 性 意味 着 我 们 总 可 以 构造 一 台 DFA 来 模拟 一 台 特 定 的 NFA。 这 台 DFA 有 一 个 状 
态 表 示 这 台 NFA 的 每 一 个 可 能 状态 的 集合 ， 并 且 DFA 状态 之 间 移 动 的 规则 对 应 着 NFA 
的 确定 性 模拟 在 它 可 能 状态 的 集合 之 间 的 移动 方式 。 这 台 DFA 将 能 够 完全 模拟 NFA 的 行 
为 ,并且 只 要 为 DFA 选择 合适 的 接受 状态 一 一 根据 我 们 的 Ruby 实现 ， 这 些 将 是 与 处 于 接 
受 状态 的 NFA 对 应 的 任何 状态 一 一 它 也 将 接受 同样 的 字符 串 。 


让 我 们 尝试 着 为 一 台 特 定 的 NFA 做 这 种 转换 。 以 下 面 这 个 为 例 : 
































注 7: 尽管 一 台 NFA 只 有 一 个 起 始 状态 ， 但 自由 移动 使 得 读 取 任何 输入 之 前 进入 其 他 状态 成 为 可 能 。 











最 简单 的 计算 机 | 89 


在 没有 读 取 任何 输入 之 前 ， 这 台 NFA 可 能 处 于 状态 1 或 者 状态 2 (状态 1 是 起 始 状态 ， 而 
状态 2 可 以 通过 自由 移动 到 达 )， 因 此 模拟 将 从 可 以 叫 作 “1 或 者 2” 的 状态 开始 。 从 这 个 
起 点 出 发 ， 根 据 它 读 到 的 是 a 或 b， 模 拟 将 会 在 不 同 的 状态 终止 。 





。 如 有 果 读 到 a， 模 拟 仍 将 保持 在 状态 “1 或 者 2”: NFA 处 于 状态 1 时 它 可 以 读 入 a， 然 后 
或 是 维持 在 状态 1 或 是 进入 状态 2， 而 从 状态 2 开始 ， 它 没 法 再 读 入 a 了 。 

如 果 读 到 b, NFA 可 能 会 终止 于 状态 2 或 者 状态 3 (从 状态 1 开始 ), 它 不 能 再 读 到 b 了 ， 
但 是 从 状态 2 开始 ， 它 可 以 移动 到 状态 3 并 且 还 可 能 自由 移动 回 状 态 2， 因 此 ， 我 们 说 
输入 为 b 的 时 候 ， 模 拟 将 移动 到 叫 作 “2 或 者 3” 的 状态 。 

















通过 思考 一 个 NFA 模拟 的 行为 ， 我 们 可 以 为 这 个 模拟 构造 一 台 状 态 机 : 

















万 六 
4 “2 或 者 3” 是 模拟 的 一 个 接受 状态 ， 因 为 状态 3 是 NFA 的 一 个 接受 状态 。 
~ 





可 以 继续 这 个 过 程 发 现 模拟 的 更 多 新 状态 ， 直 到 不 再 有 新 发 现 为 止 。 因 为 原始 NFA 的 状 
态 只 有 有 限 数 目的 可 能 组 合 ， 所 以 最 后 肯定 能 停止 发现。* 通过 重复 对 示例 NFA 的 发 现 过 
程 ， 我 们 发 现 从 “1 或 者 2” 出 发 然后 读 取 a 和 的 序列 ， 它 的 模拟 只 能 磁 到 四 种 不 同 的 
状态 组 合 : 




















如 果 NFA 处 于 状态 …… 并 且 读 入 字符 …… 它 可 能 终止 于 状态 …… 
1 或 2 a 1 或 2 
b 2 或 3 
2 或 3 a 无 
b 1、2 或 3 
无 a 无 
b 无 
1、2 或 3 a 1 或 2 
b 1、2 或 3 


此 表 完 整地 描述 了 一 台 DFA， 如 下 图 所 示 ， 它 与 原始 的 NFA 接受 同样 的 字符 串 : 








注 8， 模拟 一 个 三 状态 的 NEA 时 ,最 差 情况 是 “1” “2” “3” “1 或 者 2” “1 或 者 3 “2 或 者 3" “1 2 或 者 3 
和 无 。 
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这 个 DFA 只 比 我 们 开始 的 NFA 多 出 一 个 状态 ， 而 且 对 于 一 些 NFA， 这 个 过 
心 。 程 可 能 会 产生 比 原 始 机 器 的 状态 更 少 的 DFA。 但 是 在 最 坏 情况 下 ， 一 台 有 7 
“个 状态 的 NFA 可 能 需要 一 台 有 2" 个 状态 的 DFA， 因 为 n 个 状态 总 共有 "个 
可 能 组 合 (考虑 把 每 个 组 合 都 表示 成 一 个 n 比特 的 数字 ， 其 中 第 个 比特 表 
示 状 态 n 是 否 包含 在 这 个 组 合 中 )， 并 有 旦 模拟 可 能 需要 访问 其 中 所 有 的 组 合 
而 不 仅仅 是 其 中 一 部 分 。 


























下 面 我 们 用 Ruby 实现 这 个 NFA 到 DFA 的 转换 。 策 略 是 引入 一 个 新 的 类 NFASimulation， 用 
来 收集 NFA 模拟 的 信息 然后 把 这 些 信息 汇总 成 一 台 DFA 。NFASimulation 根据 特定 的 
NFADesign 创建 ， 并 且 最 后 提供 一 个 共 o_dfa_design 方法 把 它 转 换 成 等 价 的 DFADesign。 


我 们 已 经 有 了 可 以 模拟 NFA 的 NFA 类 ， 因 此 NFASimulation 可 以 创建 NFA 的 实例 ， 然 后 操 
纵 这 个 实例 天 清楚 对 所 有 可 能 的 输入 它们 都 是 如 何 响应 的 。 在 开始 写 NFASimulation 之 前 ， 
我 们 先 回 到 NFADesign 并 且 给 NFADesigntto_nfa 增加 一 个 可 选 的 参数 “当前 状态 *， 这 样 就 
可 以 使 用 任意 集合 的 当前 状态 构建 一 台 NFA， 而 不 是 只 能 使 用 NFADesgin 的 起 始 状态 : 











class NFADesign 
def to nfa(current states = Set[start state]) 
NFA.new(current states, accept states, rulebook) 
end 
end 


此 前 ,一 台 NFA 的 模拟 只 能 从 它 的 起 始 状态 开始 ， 但 这 个 新 的 参数 让 它 可 以 从 其 他 任何 
点 起 步 : 


>> rulebook = NFARulebook.new([ 
FARule.new(1, 'a', 1), FARule.new(1, 'a', 2), FARule.new(1, nil, 2), 
FARule.new(2, 'b', 3), 
FARule.new(3, 'b', 1), FARule.new(3, ni]l, 2) 
]) 
=> #<struct NFARulebook rules=[...]> 
>> nfa design = NFADesign.new(1, [3], rulebook) 
=> #<struct NFADesign start state=1, accept states=[3], rulebook=...> 
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>> nfa design.to nfa.current states 

=> #<Set: {1, 2}> 

>> nfa design.to nfa(Set[2]).current states 
=> #<Set: {2}> 
>> nfa design.to nfa(Set[3]).current states 
=> #<Set: {3, 2}> 


寺 sa， 








这 个 NFA 类 自动 把 自由 移动 考虑 进来 了 
。 时 候 ， 无 需 读 取 任何 输入 它 就 可 能 处 于 状态 2 或 者 3。 因 此 为 了 支持 自由 移 
心动 ,我们 不 用 做 任何 特别 的 事情 。 

















可 以 看 到 NFA 从 状态 3 开始 的 





现在 我 们 可 以 用 任何 可 能 状态 的 集合 创建 一 台 NFA， 向 其 输入 一 个 字符 ， 然 后 看 它 最 终 可 
能 处 于 什么 状态 。 这 是 把 一 台 NFA 转换 成 一 台 DFA 重要 的 一 步 。 在 NFA 处 于 状态 2 或 
者 3 并 且 读 入 一 个 b 的 时 候 ， 之 后 它 可 能 处 于 什么 状态 呢 ? 


>> nfa = nfa design.to nfa(Set[2, 3]) 
=> #<struct NFA current states=#<Set: {2, 3}>, accept states=[3], rulebook=...> 
>> nfa.read character('b'); nfa.current states 
=> #<Set: {3, 1, 2}> 





答案 是 状态 1、2 或 者 3， 就 像 我 们 在 手工 转换 过 程 中 发 现 的 那样 。( 请 记 住 ,集合 中 元 素 


的 顺序 没关系 。) 


让 我 们 使 用 这 个 思想 创建 NFASimulation 类 ， 给 它 增 加 一 个 方法 计算 模拟 的 状态 如 何 根据 
某 一 个 特定 的 输入 而 改变 。 我 们 把 模拟 的 状态 看 成 这 台 NFA 当前 可 能 状态 的 集合 (例如 


“1、2 或 者 3”)， 








大 








此 可 以 写 一 个 #next_state 方法， 以 一 个 模 


拟 的 状态 和 一 个 字符 为 参 





数 ， 把 这 个 字符 传递 给 对 应 那个 状态 的 一 台 NFA， 之 后 通过 监视 这 台 NFA 得 到 一 个 新 的 


Class NFASimulation < Struct.new(:nfa design) 
def next state(state, character) 
nfa design.to nfa(state).tap { |nfal 
nfa.read character(character) 
}.current states 


end 
end 

















这 让 我 们 可 以 很 方便 地 考察 模拟 的 不 同 状 态 : 


>> simulation = NFASimulation.new(nfa design) 
=> #<struct NFASimulation nfa design=...> 


这 里 讨论 的 两 种 状态 很 容易 让 人 感到 迷惑 。 模 拟 的 一 个 状态 
-Ee (NFASimulation#next_state 的 state 参数 ) 是 许多 NFA 状态 的 一 个 集合 ， 这 
是 为 什么 我 们 可 以 把 它 作 为 NFADesign#to_nfa 的 current_states 参数 的 原因 。 
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>> simulation.next state(Set[1, 2], 'a') 

=> #<Set: {1, 2}> 

>> simulation.next_ state(Set[1, 2], 'b') 

=> #<Set: {3, 2}> 

>> simulation.next_state(Set[3, 2], 'b') 

=> #<Set: {1, 3, 2}> 

>> simulation.next state(Set[1, 3, 2], 'b') 
=> #<Set: {1, 3, 2}> 

>> simulation.next state(Set[1, 3, 2], 'a') 
=> #<Set: {1, 2}> 


现在 需要 一 种 方式 能 系统 地 考察 模拟 的 状态 并 把 我 们 的 发 现 记录 成 一 台 DFA 的 状态 


和 规则 。 我 人 


] 打 算 直 接 使 用 每 个 模拟 的 状态 作为 一 个 DFA 状态 ， 因 此 第 一 步 是 实现 


NFASimulation#rules for， 它 使 用 #next_state 发 现 每 一 个 规则 的 目的 状态 ， 从 一 个 特定 
的 模拟 状态 出 发 构建 出 全 部 规则 。 "全 部 规则 ”意味 着 它 是 对 每 一 个 可 能 的 输入 字符 适用 





因此 我 们 还 定义 了 辅助 方法 NFARulebook#alphabet 来 了 解 原始 的 NFA 可 以 





读 取 哪 些 字符 : 


class NFARulebook 


def alp 


rules. 


end 
end 


habet 
map(&:character).compact.uniq 


class NFASimulation 


def rul 
nfa d 
FAR 
上 
end 
end 


如 预期 一 样 ， 





es for(state) 
esign.rulebook.alphabet.map { |character| 
ule.new(state, character, next state(state, character)) 


这 让 我 们 看 到 了 在 不 同 的 状态 之 间 不 同 的 输入 将 会 如 何 模拟 : 


>> rulebook.alphabet 


=> ["a", 
>> simula 
=> [ 


| 
tion.rules for(Set[1, 2]) 


#<FARule #<Set: {1, 2}> --a--> #<Set: {1, 2}>>, 
#<FARule #<Set: {1, 2}> --b--> #<Set: {3, 2}>> 


] 
>> simula 
=> |[ 


tion.rules for(Set[3, 2]) 


#<FARule #<Set: {3, 2}> --a--> #<Set: {}>>， 
#<FARule #<Set: {3, 2}> --b--> #<Set: {1, 3, 2}>> 


] 





方法 #7ules_for 让 我 们 可 以 通过 已 知 的 模拟 状态 发 现 新 的 状态 ， 并 且 通 过 反复 对 其 执行 ， 
我 们 可 以 找到 所 有 可 能 的 模拟 状态 。 我 们 可 以 使 用 NFASimulation#discover_states_and_ 


rules 方法 ， 





它 采 用 类 似 NA bdo oi free_moves 的 方法 递归 找到 更 多 的 状态 。 
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class NFASimulation 
def discover states and rules(states) 
rules = states.flat map { |state| rules for(state) } 
more states = rules.map(&:follow).to set 


if more states.subset?(states) 
[states, rules] 
else 
discover states and rules(states + more states) 
end 
end 
end 








discover_states_and_rules 并 不 关心 模拟 状态 背后 的 状态 ， 而 只 有 这 个 状 
CS》 态 才 能 用 作 #rule_for 的 参数 。 但 是 作为 程序 员 ， 还 有 一 个 地 方 可 能 让 我 们 
困惑 。 变 量 states 和 more_states 是 模拟 状态 的 集合 ， 但 是 我 们 知道 每 一 个 
模拟 状态 本 身 是 一 个 NFA 状态 的 集合 ， 因 此 states 和 more_states 实际 上 
是 NFA 状态 集合 的 集合 。 

















最 初 ， 我 们 只 知道 模拟 的 一 个 状态 NFA 进入 起 始 状态 时 的 可 能 状态 集合 。#discover_ 
states_and_rules 从 这 个 起 点 开始 探索 ， 最 终 找 到 所 有 的 4 个 状态 和 模拟 的 8 个 规则 : 


>> start state = nfa design.to nfa.current states 














=> #<Set: {1, 2}> 
>> simulation.discover states and rules(Set[start state]) 
=> [ 
#<Set: { 
#<Set: {1, 2}>, 
#<Set: {3, 2}>, 
#<Set: {}>, 
#<Set: {1, 3, 2}> 
]>， 
[ 
#<FARule #<Set: {1, 2}> --a--> #<Set: {1，2}>>， 
#<FARule #<Set: {1, 2}> --b--> #<Set: {3, 2}>>, 
#<FARule #<Set: {3, 2}> --a--> #<Set: {}>>， 
#<FARule #«<Set: {3, 2}> --b--> #<Set: {1, 3, 2}>>, 
#<FARule #<Set: {}> --a--> #<Set: {}>>, 
#<FARule #<Set: {}> --b--> #<Set: {}>>, 
#<FARule #«<Set: {1, 3, 2}> --a--> #<Set: {1, 2}>>, 
#<FARule #«<Set: {1, 3, 2}> --b--> #<Set: {1, 3, 2}>> 
] 
] 














最 后 我 们 要 知道 的 是 ， 每 一 个 模拟 状态 是 否 应 该 被 处 理 成 一 个 接受 状态 ， 但 是 在 模拟 中 很 
容易 通过 查询 NFA 得 到 结果 : 
>> nfa design.to nfa(Set[1, 2]).accepting? 


=> false 
>> nfa design.to nfa(Set[2, 3]).accepting? 





=> true 











既然 我 们 有 了 模拟 DFA 的 所 有 部 件 ， 现 在 只 需 一 个 NFASimulation#to_dfa_design 方法 把 
它们 封装 成 一 个 DFADesign 实例 : 


class NFASimulation 
def to dfa design 








start state = nfa design.to nfa.current states 
states, rules = discover states and rules(Set[start statel]) 


accept states 


states.select { |state| nfa design.to nfa(state).accepting? } 


DFADesign.new(start state, accept states, DFARulebook.new(rules)) 


end 
end 


就 这 样 。 我 们 可 以 使 用 任何 NFA 构造 一 个 NFASimulation 实例 ， 并 把 它 转 换 成 一 个 接受 同 


样 字符 串 的 DFA: 





>> dfa design = simulation.to dfa design 


=> #<struct DFADesign .. 


.> 


>> dfa design.accepts?('aaa') 


=> false 


>> dfa design.accepts?('aab') 


=> true 


>> dfa design.accepts?('bbbabb') 


=> true 
棒 极 了 ! 
在 本 市 的 开始 ， 我 们 问 过 





NFA 的 额外 特性 是 否 能 做 一 台 DFA 完成 不 了 的 事情 。 现 在 很 明 


显 管 案 为 否 ， 因 为 如 果 任 何 NFA 都 可 以 转 成 一 台 做 同样 工作 的 DFA， 那 么 NFA 就 不 会 有 
额外 的 能 力 。 非 确定 性 和 自由 移动 只 是 一 台 DFA 已 经 能 做 的 工作 的 再 包装 ， 就 像 编 程 语 
言 里 中 的 语法 糖 一 样 ， 它 们 不 是 让 我 们 超越 确定 性 约束 的 新 能 


理论 上 说 ， 为 一 台 简 单 的 机 器 增加 更 多 的 特性 却 没 有 为 它 根 本 上 增加 更 多 的 能 力 非常 有 


趣 ， 但 实际 上 这 是 很 有 用 
要 跟踪 ， 并 且 一 台 DFA 月 








的 ， 因 为 一 台 DFA 比 一 台 NFA 更 容易 模拟 : 只 有 一 个 当前 状态 
日 硬件 或 者 机 器 代码 实现 起 来 足够 简单 ， 可 以 使 用 程序 存储 位 置 





作为 状态 ， 用 条 件 分 支 作为 规则 。 这 意味 着 一 个 正则 表达 式 的 实现 可 以 把 一 个 模式 先 转换 











成 一 台 NFA 然后 再 转换 成 一 台 DFA， 得 到 一 台 能 被 快速 高 效 模拟 的 非常 简单 的 机 器 。 
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DFA 最 小 化 


一 些 DFA 的 特性 是 最 小 化 的 ， 就 是 说 无 法 设计 出 一 台 能 接受 同样 字符 串 但 是 状态 更 少 
的 DFA。NFA 到 DFA 的 转换 过 程 有 时 候 会 产生 包含 完 余 状态 的 非 最 小 化 DFA， 但 是 
有 一 种 优雅 的 方式 可 以 去 除 这 种 宛 余 ， 叫 作 Brzozowski 算法 。 


(1) 从 你 的 非 最 小 化 DFA 开始 。 

(2) 反 转 所 有 规则 。 从 形象 的 表示 上 说 ， 这 意味 着 表示 机 器 的 图 上 每 一 个 箭头 都 保持 
原 位 但 是 方向 反 转 ; 从 代码 上 说 ， 每 一 个 FARule.new(state， character， next 
state) 被 替换 成 FARule.new(next state,character，state)。 反 和 转 规则 通常 会 打破 
确定 性 约束 ， 因 此 现在 你 有 了 一 台 NFA。 

(3) 交换 起 始 状 态 和 接受 状态 的 角色 : 起 始 状 态 成 为 接受 状态 ， 而 每 一 个 接受 状态 成 为 
一 个 起 始 状态 。( 因 为 一 台 NFA 只 有 一 个 起 始 状态 ， 所 以 你 不 能 直接 把 所 有 的 接受 
状态 变 成 起 始 状态 ， 但 是 你 可 以 创建 一 个 新 的 起 始 状态 ， 然 后 通过 自由 移动 把 它 与 
每 一 个 旧 的 接受 状态 连接 起 来 ， 这 样 效 果 是 一 样 的 。) 

(4) 把 这 个 反 转 的 NFA 按 通常 方式 转换 成 一 台 DFA。 


奇怪 的 是 ， 这 样 得 到 的 DFA 保证 是 最 小 的 而 且 不 含 宛 余 状 态 。 遗 憾 的 缺点 是 它 只 能 
接受 原始 DFA 字符 串 的 颠倒 版 本 : 如 果 我 们 原始 的 DFA 接受 字符 串 'ab'、'aab'、 
'aaab' 等 ， 那 这 个 最 小 化 的 DFA 将 接受 'ba'、'baa' 和 'baaa' 形式 的 字符 囊 。 修 正 
方法 是 简单 地 第 二 次 执行 整个 过 程 ， 从 反 转 的 DFA 开始 再 得 到 一 个 二 次 反 转 的 DFA， 
它 还 能 保证 是 最 小 的 ， 但 这 次 能 接受 与 我 们 开始 的 那 台 机 器 一 样 的 字符 事 了 。 


能 有 一 种 自动 的 方法 去 除 设 计 中 的 完 余 是 很 美好 的 。 但 有 趣 的 是 ， 一 台 最 小 化 的 DFA 
也 是 标准 的 : 接受 完全 相同 字符 串 的 任何 两 台 DFA 将 最 小 化 成 为 同样 的 机 器 ， 因 此 我 
们 可 以 把 两 人 台 NFA 最 小 化 然后 比较 结果 看 它们 结构 是 否 相同 ， 以 此 来 检查 两 台 DFA 
是 否 等 价 。 "这 反 过 来 提供 了 一 种 优雅 的 方法 ， 可 以 检查 两 个 正则 表达 式 是 否 等 价 ; 如 
果 我 们 把 与 同一 个 字符 串 匹 配 的 两 个 模式 (例如 ab(ab)* 和 a(ba)*b) 转换 成 NFA， 
把 这 些 NFA 转 成 DFA， 然 后 把 两 台 DFA 使 用 Brzozowski 算法 最 小 化 ， 最 终 将 得 到 两 
台 看 起 来 一 样 的 机 器 。 








注 





9: 解决 这 个 图 的 同 构 问 题 本 身 要 求 一 个 聪明 的 算法 ， 但 非 正 式 地 检查 两 台 机 器 的 结构 图 并 确定 它们 是 否 
“相同 ” 却 足 够 简单 。 
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| 第 3 章 





第 4 章 


增加 计算 能 力 





第 3 章 探讨 了 有 限 自动 机 ， 这 是 一 种 假想 的 机 器 ， 它 去 掉 了 真实 计算 机 的 复杂 性 并 把 其 规 
约 成 了 最 简单 的 形式 。 我 们 详细 考察 了 这 些 机 器 的 行为 并 了 解 了 它们 的 用 处 ， 而 且 还 发 
现 ， 非 确定 性 有 限 自 动机 虽然 有 一 些 奇特 的 执行 方法 ， 但 计算 能 力 并 不 比 确 定性 有 限 自动 
机 强 。 


我 们 没 法 通过 为 有 限 自 动机 增加 非 确 定性 和 自由 移动 这 种 奇特 的 特性 来 提高 它 的 计算 能 
力 。 这 个 事实 表明 ， 我 们 已 经 停留 在 这 些 简单 机 器 的 计算 水 平 上 无 法 前 进 了 。 而 且 如 果 
不 从 根本 上 改变 机 器 的 工作 方式 ， 将 无 法 脱离 这 种 停 请 不 前 的 境地 。 那 么 ， 所 有 这 些 机 
器 到 底 有 多 强 的 能 力 呢 ? 好 吧 ， 没 有 多 少 能 力 。 它 们 被 限制 在 非常 有 限 的 应 用 上 (只 能 
接受 或 者 拒绝 字符 序列 ) ， 而 且 即 使 在 这 么 小 的 范围 内 ， 仍 然 很 容易 磁 到 机 器 无 法 识别 的 


语言 。 


举 个 例子 ， 假 设 要 设计 一 台 有 限 自 动机 ， 要 求 它 能 读 取 带 有 左右 括号 的 字符 串 ， 并 且 只 
字符 串 中 的 左右 括号 是 平衡 的 〈 即 每 一 个 右 括号 都 能 在 字符 串 中 找到 与 其 匹配 的 左 括号 )， 
它 才 会 接受 。- 


解决 这 个 问题 的 一 般 策略 是 一 次 读 取 一 个 字符 ， 同 时 跟踪 一 个 表示 当前 嵌 套 级 别 的 数字 : 
读 入 一 个 左 括号 时 增加 和 嵌 套 级 别 ， 读 入 一 个 右 括 号 时 降低 戏 套 级 别 。 只 要 秽 套 级 别 到 零 
了 ， 就 表示 当前 读 到 的 这 些 括 号 已 经 都 匹配 上 了 (因为 嵌 套 级 别 增加 和 减少 的 数量 是 一 
样 的 )， 并 且 如 果 我 们 试图 把 徐 套 级 别 降低 到 小 于 零 的 值 ， 那 就 表明 当前 的 右 括 号 多 了 
































注 1: 这 与 接受 仅 包含 同样 数量 的 左右 括号 的 字符 串 完 全 不 同 。 字 符 串 '()' 和 ')(' 都 有 一 个 左 括号 和 一 个 
右 括 号 ， 但 只 有 “() 是 平衡 的 。 
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(如 'O 〇 0)'), 不 管 还 有 什么 字符 没有 读 取 ， 字 符 串 里 的 括号 一 定 已 经 不 平衡 了 。 
作为 一 个 良好 的 开始 ， 我 们 可 以 为 这 个 任务 设计 一 台 NFA。 下 面 是 拥有 四 个 状态 的 NFA: 


-0 


每 个 状态 都 对 应 一 个 能 套 级 别 ， 读 取 一 个 左 括号 或 者 一 个 右 括 号 会 分 别 让 机 器 转移 到 与 更 
高 或 者 更 低级 别 对 应 的 状态 ,“ 设 有 租 套 ”对 应 的 就 是 接受 状态 。 我 们 已 经 实现 了 用 Ruby 
模拟 这 台 NFA 所 需要 的 一 切 ， 因 此 来 运行 一 下 




















>> rulebook = NFARulebook.new([ 
FARule.new(0, '(', 1), FARule.new(1, ')', 0), 
FARule.new(1, '(', 2), FARule.new(2, ')', 1), 
FARule.new(2, '(', 3), FARule.new(3, ')', 2) 


=> #<struct NFARulebook rules=[...]> 
>> nfa design = NFADesign.new(0, [0], rulebook) 
=> #<struct NFADesign start state=0, accept states=[0], rulebook=...> 


对 于 某 些 输入 ， 我 们 的 NFA 工作 得 很 好 。 它 能 确定 '(()' 和 '())' 的 括号 不 平衡 ， 而 
《GO) 的 括号 是 平衡 的 ， 它 甚至 能 识别 '(((() 0))' 这 种 更 为 复杂 的 平衡 字符 串 : 





>> nfa design.accepts?('(()') 
=> false 
>> nfa design.accepts?('())') 
=> false 
>> nfa design.accepts?('(())') 
=> true 


>> nfa_ design.accepts?('(()(()()))') 
=> true 


可 是 这 种 设计 有 一 个 严重 的 缺陷 : 如果 括号 的 典 套 等 级 超过 3， 它 就 会 失败 。 它 没有 足够 
多 的 状态 跟踪 '(((())))' 这 样 的 字符 串 的 胜 套 ， 因 此 即使 括号 明显 是 平衡 的 它 也 会 拒绝 : 


>> nfa design.accepts?('(((())))') 
=> false 








我 们 可 以 通过 临时 增加 更 多 的 状态 来 修正 此 问题 。 一 台 拥 有 5 个 状态 的 NFA 可 以 识别 任 
意 嵌 套 级 别 小 于 5 的 平衡 字符 串 ， 而 一 台 拥 有 10 个 、100 个 或 者 1000 个 状态 的 NFA， 可 
以 识别 姐 套 级 别 cn sp 但 是 ， 我 们 如 何 设 计 支 持 任意 艇 和 套 
级 别 、 能 识别 任意 平衡 字符 串 的 NFA 呢 ? 结论 是 设计 不 出 来 : 一 台 有 限 自动 机 的 状态 数 
总 是 有 限 的 ， | 也 总 是 有 限 的 ， 我 们 只 要 提供 一 个 比 它 能 处 
里 的 典 套 级 别 多 一 级 的 字符 串 ， 它 就 无 法 处 理 了 。 















































根本 问题 是 一 台 有 限 自动 机 只 有 固定 的 状态 集合 ， 因 而 其 存储 是 有 限 的 ， 因 此 没 法 跟踪 
任意 数量 的 信息 。 在 平衡 字符 串 问题 当中 ， 一 台 NFA 很 容易 递增 到 设计 时 限制 的 某 个 最 


大 数目 ， 但 无 法 继续 计数 以 适应 任何 可 能 大 小 的 输入 。 "本质 上 大 小 固 
字符 串 'abc' 进行 匹配 ) ， 或 者 无 需 跟踪 重复 次 数 的 任务 (比如 对 正则 表达 式 ab*c 进 



































定 的 任务 (比如 对 
行 匹 


配 )， 都 不 受 这 个 问题 的 影响 ， 但 在 信息 数目 不 可 预知 ， 需 要 在 计算 过 程 中 存储 并 在 之 后 
重用 的 场景 下 ， 这 个 问题 会 让 有 限 自 动机 无 能 为 力 。 











正则 表达 式 和 散 套 字符 串 


我 们 已 经 看 到 ， 有 限 自 动机 与 正则 表达 式 关系 密切 。3.3.2 节 展 示 了 如 何 把 任意 一 个 正 
则 表达 式 转换 成 一 台 NFA， 并 且 实 际 上 还 有 一 个 算法 可 以 把 任意 NFA 转换 回 一 个 正 
则 表达 式 。? 这 告诉 我 们 正则 表达 式 与 NFA 等 价 并 且 拥 有 同样 的 限制 ， 因 此 也 不 可 能 
使 用 正则 表达 式 识别 括号 组 成 的 平衡 字符 囊 ， 也 不 能 识别 所 有 定义 中 罕 涉 吝 套 任意 深 
度 配 对 情况 的 语言 。 


关于 这 个 缺点 ， 最 知名 的 例子 就 是 正则 表达 式 无 法 区 分 有 效 HIML 和 无 效 HTML 
(http://stackoverflow.com/a/1732454) 这 一 事实 。 许 多 HTML 元 素 要 求 开 闭 标记 成 对 
出 现 ， 而 这 些 标记 自身 还 可 能 封装 着 其 他 元 素 ， 因 此 有 限 自 动机 没有 足够 的 能 力 读 取 
HTML 字符 囊 ， 并 同时 跟踪 哪些 标记 没有 配 上 对 以 及 它们 谋 套 的 深度 是 多 少 。 


但 实际 上 ， 现 实 世 界 中 的 “正则 表达 式 ” 库 经 常 超越 正则 表达 式 理论 上 所 拥有 的 能 
Ruby 的 Regexp 对 象 提 供 的 很 多 特性 都 不 在 正则 表达 式 的 形式 定义 当中 ， 而且 这 些 特 
性 提供 的 额外 能 力 可 以 识别 更 多 语言 。 

Regexp 加 强 的 一 点 就 是 可 以 把 一 个 子 表 达 式 用 (?<name>) 语法 标记 ， 然 后 在 别 的 地 方 
使 用 \g<name>“ 调 用 ”这 个 子 表 达 式 。 能 够 引用 自己 的 子 表 达 式 ， 这 使 得 一 个 Regexp 
能 够 递归 调用 自身 ， 这 让 匹配 任意 深度 的 成 对 吝 套 成 为 可 能 。 





























刚 如 ， 尽 管 NFA 不 能 匹配 括号 的 平衡 字符 囊 (因此 理论 上 说 正则 表达 式 也 不 能 )， 但 
子 表达 式 调用 允许 我 们 写 出 匹配 这 种 字符 串 的 RegXp。 下 面 就 是 这 个 Regxp 的 样子 : 
balanced = 
/ 
\A # 匹配 开始 于 字符 串 的 开头 
(?<brackets> # 叫 作 “brackets" 的 子 表 达 式 开始 
\( # 匹配 左 括号 
\g<brackets>* # 匹配 子 表达 式 "brackets" 零 次 或 者 多 次 
\) # 匹配 右 括号 














E 2: 这 并 不 是 说 一 个 输入 字符 串 真 的 可 以 是 无 限 的 ， 只 是 说 我 们 可 以 根据 需要 让 它 尽 可 能 有 限 地 大 。 
主 3: 简单 地 说 ， 这 个 算法 通过 把 一 台 NFA 转换 成 广义 非 确定 性 有 限 自动 机 (GNFA) 来 完成 工作 。GNFA 
是 这 样 一 种 有 限 状态 机 ， 每 一 个 规则 都 用 一 个 正则 表达 式 标 记 (而 不 是 用 一 个 字符 标记 )， 然 后 不 断 
合并 这 台 GNFA 的 状态 和 规则 ， 直 到 只 剩 下 两 个 状态 和 一 个 规则 为 止 。 最 后 剩 下 的 规则 上 标记 的 正 















































则 表达 式 总 是 与 原始 NFA 匹配 相同 的 字符 串 。 
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) # 子 表 达 式 结束 
* # 重复 整个 模式 零 次 或 多 次 
\z # 匹配 结束 于 字符 串 的 结尾 








子 表达 式 (?<brackets>...) 匹配 一 对 开 闭 括号 ， 但 在 括号 内 ， 它 还 能 匹配 任意 次 数 的 
自身 ， 因 此 整个 模式 可 以 正确 识别 说 套 任意 深度 的 括号 : 

>> ['(O)! ， "0 ，"(())', ee "(CCC ON)))' .grep(balanced) 
=> ["(O)", "(OOO)", "(Cl (CO))))))))))"] 

这 种 方式 能 行 ， 只 是 因为 Ruby 的 正则 表达 式 引擎 使 用 了 调用 栈 跟踪 (?<brackets>...)， 
A EE 做 到 的 。 下 一 节 里 ， 我 们 将 看 到 如 何 扩 展 有 限 自 动机 ， 让 它 也 
获得 这 种 能 

是 的 ， 你 也 可 以 用 同样 的 思想 写 一 个 Regxp 匹配 谋 套 的 HTML 标记 ， 但 肯定 不 值得 花 
这 个 时 间 。 











很 明显 这 些 机 器 的 能 力 存在 局 限 性 。 如 果 非 确定 性 不 足以 让 有 限 自动 机 能 力 更 强 ， 那 什么 
才能 赋予 它 更 多 的 能 力 呢 ? 现在 的 问题 来 源 是 机 器 有 限 的 存储 ， 因 此 我 们 可 以 增加 一 些 存 
储 看 看 怎么 样 。 


本 
4.1 确定 性 下 推 自动 机 

为 了 解决 存储 问题 ， 我 们 可 以 使 用 专门 的 原始 空间 扩展 有 限 状 态 自动 机 ， 它 负责 在 计算 
过 程 中 存储 数据 。 除 状态 提供 的 有 限 内 部 存储 之 外 ， 这 个 空间 给 了 机 器 一 种 外 部 存储 
(external memory)。 就 像 我 们 将 会 发 现 的 那样 ， 拥 有 外 部 存储 对 于 一 台 机 器 的 计算 能 力 关 
系 重大 。 


4.1.1 存储 


为 有 限 自 动机 增加 存储 的 简单 方式 就 是 让 它 可 以 访问 栈 ， 这 是 一 个 后 进 先 出 的 数据 结构 ， 可 
以 把 字符 推 和 信和 弹出 。 栈 是 简单 而 且 有 限制 的 数据 结构 一 一 在 任意 时 间 都 只 有 项 端的 字符 可 
以 访问 。 为 了 查 明 栈 下 面 位 置 的 数据 ， 我 们 只 能 丢弃 顶层 的 字符 ， 而 一 旦 向 栈 内 推 入 一 串 字 
符 ， 我 们 就 只 能 按 相 反 的 顺序 把 它们 弹出 一 一 但 它 确实 可 以 很 好 地 解决 有 限 存储 的 问题 。 对 
于 栈 的 大 小 并 没有 内 在 的 限制 ， 因 此 原则 上 它 可 以 根据 需要 存储 数据 。” 


自 带 栈 的 有 限 状 态 机 叫 作 下 推 自动 机 (PushDown Automaton，PDA)， 如 果 这 人 台 机 器 的 
规则 是 确定 性 的 ， 我 们 就 叫 它 确定 性 下 推 自动 机 (Deterministic PushDown Automaton， 












































注 4: 当然 ， 栈 在 现实 世界 中 的 任何 实现 都 受 限 于 计算 机 的 RAM， 或 者 硬盘 上 的 空闲 空间 ， 或 者 宇宙 中 原 
子 的 数量 ， 但 是 对 于 思维 实验 ， 我 们 将 认为 这 些 约 束 都 不 存在 。 

















DPDA)。 能 对 栈 进行 访问 带 来 了 新 的 可 能 性 ， 例 如 ， 很 容易 设计 一 台 DPDA 来 识别 括号 
组 成 的 平衡 字符 串 。 下 面 是 它 的 工作 方式 。 





。 给 机 器 两 个 状态 : 1 和 2， 状 态 1 作为 接受 状态 。 

。 状态 1 作为 机 器 的 起 始 状 态 ， 此 时 栈 为 空 。 

。 如 果 处 于 状态 1 并 且 读 入 一 个 左 括号 ， 就 把 某 个 字符 一 一 我 们 使 用 b 表示 “括号 ”一 一 
入 栈 ， 并 转移 到 状态 2。 

。 如 果 处 于 状态 2 并 且 读 入 一 个 左 括号 ， 就 把 字符 bp 入 栈 。 

。 如 果 处 于 状态 2 并 且 读 入 一 个 右 括 号 ， 就 把 字符 b 从 栈 中 弹出 。 

。 如 果 处 于 状态 2 且 栈 为 空 ， 就 转移 回 状态 1。 

这 台 DPDA 使 用 栈 的 大 小 来 记录 到 目前 为 止 没 有 配 上 对 的 左 括号 数目 。 栈 为 空 时 ， 意 味 着 

每 一 个 左 括号 都 已 经 匹配 上 了 右 括号 ， 因 此 字符 串 一 定 是 平衡 的 。 我 们 观察 一 下 机 器 读 入 

字符 串 '(()(()O 〇 ))' 时 栈 的 增长 和 缩减 情况 : 





























状态 是 否 接 受 栈 的 内 容 剩余 输入 动作 

1 是 (0O(OO)) 读 入 (， 推 人 b， 转 移 到 状态 2 
2 否 b ()(()0)) 读 入 (, 推 人 人 b 
2 否 bb )(((O)) 读 入 )， 弹 出 b 
2 否 b (OO)) 读 入 (, 推 信 b 
2 否 bb (OO)) 读 入 (, 推 信 b 
2 否 bbb )())) 读 入 )， 弹 出 b 
2 否 bb )) 读 入 (, 推 信 b 
2 否 bbb )) 读 入 ), 弹出 b 
2 否 bb )) 读 入 )， 弹 出 b 
2 否 b ) 读 入 )， 弹 出 b 
2 否 转移 到 状态 1 
是 
4.1.2 ”规则 





括号 平衡 问题 DPDA 背后 的 思想 非常 简单 ， 但 在 我 们 实际 构建 它 之 前 ， 需 要 弄 清 楚 一 些 技 
术 细 市 。 首 先 ， 我们 必须 确定 下 推 自动 机 的 工作 规则 。 这 里 有 几 个 设计 问题 。 


。 每 个 规则 都 要 修改 栈 ， 或 者 读 取 输 入 ， 或 者 改变 状态 ， 还 是 三 者 都 要 做 ? 
。 推 人 和 弹出 需要 两 种 不 同 的 规则 吗 ? 

。 栈 为 空 时 ， 我 们 是 否 需要 一 种 特殊 的 规则 改变 状态 呢 ? 

。 就 像 NFA 中 的 自由 移动 那样 ， 没 有 从 输入 读 取 就 改变 状态 是 否 可 以 呢 ? 
。 如 果 一 台 DPDA 可 以 自发 改变 状态 ， 那 “确定 性 ”是 什么 意思 呢 ? 














通过 选择 一 种 足够 灵活 、 能 满足 所 有 要 求 的 规则 类 型 ， 我 们 可 以 回答 全 部 问题 。 我 们 把 一 
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个 PDA 规则 分 成 5 部 分 : 


。 机 器 的 当前 状态 ; 

。 必须 从 输入 读 取 的 字符 (可 选 ) ， 

。 机 器 的 下 一 个 状态 ; 

。 必须 从 栈 中 弹出 的 字符 ， 

。 栈 顶 字符 弹出 后 需要 推 入 栈 中 的 字符 序列 。 


前 三 部 分 很 熟悉， 它们 来 自 DFA 和 NFA 的 规则 。 如 果 一 个 规则 不 想 让 机 器 改变 状态 ， 它 
可 以 让 下 一 个 状态 与 当前 状态 一 样 ， 如 果 它 不 想 读 取 任 何 输入 (也 就 是 自由 移动 )， 则 可 
以 忽略 输入 字符 ， 只 要 这 不 让 机 器 变 成 非 确 定性 的 就 可 以 (参见 4.1.3 节 )。 


其 他 两 部 分 一 一 要 弹出 的 字符 和 要 推 入 的 字符 序列 一 一 是 PDA 特有 的 。 假 定 一 台 PDA 总 
是 要 弹出 栈 顶 字符 ， 然 后 向 栈 中 推 入 其 他 字符 。 每 一 个 规则 声明 它 想 要 弹出 哪个 字符 ， 然 
后 这 个 规则 只 会 在 这 个 字符 处 于 栈 顶 位 置 时 才 会 应 用 ， 如 果 这 个 规则 想 让 那个 字符 留 在 栈 
中 而 不 弹出 ， 它 可 以 把 这 个 字符 包含 在 后 来 要 推 入 栈 中 的 字符 序列 当中 。 


这 个 五 部 分 的 规则 格式 没有 说 明 栈 为 空 时 如 何 写 规则 ， 但 我 们 可 以 通过 选择 一 个 特殊 符号 
标记 栈 底 位 置 来 解决 一 一 流行 的 选择 是 $ 一 一 然后 每 当 想 要 检测 栈 是 否 为 空 时 ， 检 查 这 个 
符号 就 可 以 了 。 使 用 这 个 约定 时 ， 最 重要 的 是 永远 不 要 让 栈 真 的 变 空 ， 因 为 在 栈 顶 为 空 时 
没有 规则 可 以 应 用 。 机 器 开始 的 时 候 这 个 特殊 的 栈 底 符号 应 该 已 经 在 栈 中 ， 任 何 规则 在 把 
这 个 符号 弹出 之 后 必须 再 次 把 它 推 入 。 












































很 容易 用 这 种 格式 重 写 平衡 括号 的 DPDA 规则 : 


。 处 于 状态 1 而 且 读 入 左 括号 时 ， 弹 出 字符 $， 推 和 人 字符 $， 然 后 转移 到 状态 2; 

。 处 于 状态 2 而 且 读 入 左 括号 时 ， 弹 出 字符 b， 推 入 字符 bb， 然 后 保持 在 状态 2; 

。 处 于 状态 2 而 且 读 入 右 括号 时 ， 弹 出 字符 bp， 不 推 入 任何 字符 ， 然 后 保持 在 状态 2 
。 处 于 状态 2 (没有 读 入 任何 字符 ) 时 ， 弹 出 字符 $， 推 人 字符 $， 然 后 转移 到 状态 1。 








我 们 可 以 用 这 个 机 器 的 图 来 展示 这 些 规 则 。DPDA 图 看 起 来 与 NFA 图 很 像 ， 但 DPDA 图 
的 每 个 箭头 不 仅 要 标记 它 从 输入 读 取 的 字符 ， 还 要 标记 这 个 规则 需要 弹出 和 推 和 的 字符 。 
如 果 我 们 使 用 符号 a;b/cd 来 标记 一 个 规则 ， 它 表明 从 输入 读 取 a， 从 栈 中 弹出 b， 然 后 向 
栈 中 推 和 人 cd， 这 个 机 器 看 起 来 像 是 这 样 : 






































(;b/bb 
);b/ 








4.1.3 ”确定 性 
下 一 个 难题 就 是 为 PDA 准确 地 定义 确定 性 的 含义 。 对 于 DFA 来 说 ， 我 们 的 
存在 冲突 ”: 不 能 在 任何 状态 上 ， 由 于 冲突 的 规则 而 使 机 器 的 下 一 次 移动 有 

















约束 是 “不 能 
二 义 性 。 这 也 


适用 于 DPDA， 例 如 ， 在 机 器 处 于 状态 2、 下 一 个 输入 字符 是 左 括号 并 且 栈 顶 是 b 的 时 候 ， 


我 们 只 能 应 用 一 个 规则 。 甚 至 写 一 个 不 读 取 任 何 输 入 的 自由 移动 规则 都 是 可 
于 同样 的 状态 和 同样 的 栈 顶 字符 没有 其 他 规则 可 用 就 可 以 ， 因 为 这 样 在 确定 
应 该 从 输入 读 取 的 时 候 会 产生 二 义 性 。 








以 的 ， 只 要 对 
一 个 字符 是 否 


DFA 还 有 “不 能 有 遗漏 ”的 约束 (每 一 个 可 能 的 情况 都 应 该 有 一 个 规则 )， 但 是 因为 状态 、 




















输入 字符 和 栈 顶 字符 有 大 量 可 能 的 组 合 ， 所 以 这 对 于 DPDA 来 说 很 难处 理 。 














通常 只 是 忽略 


这 个 约束 并 允许 DPDA 只 定义 完成 工作 所 需 的 规则 ， 并 且 假 定 一 台 DPDA 在 没有 规则 可 














用 时 将 进入 停滞 状态 。 我 们 的 平衡 括号 DPDA 在 读 取 ')' 或 '())' 这 样 的 字 
这 种 情况 ， 因 为 处 于 状态 1 且 读 入 一 个 右 括号 时 没有 规则 可 用 。 


4.1.4 模拟 


既然 处 理 完 了 技术 细节 ， 让 我 们 构建 一 个 确定 性 下 推 自 动机 的 Ruby 模拟 吧 
与 它 交 互 了 。 在 模拟 DFA 和 NFA 的 时 候 我 们 已 经 完成 了 大 部 分 困难 的 工作 
需要 微调 。 


我 们 缺少 的 最 重要 的 东西 是 栈 。 下 面 是 一 种 实现 栈 类 的 方式 : 






































class Stack < Struct.new(:contents) 
def push(character) 
Stack.new([character] + contents) 
end 


def pop 
Stack.new(contents.drop(1)) 
end 





def top 
contents.first 
end 


def inspect 
"#<Stack (#{top})#{contents.drop(1).join}>" 
end 
end 


一 个 Stack 对 象 把 它 的 内 容 存 储 在 一 个 数组 内 并 把 简单 的 #push 和 #pop 操作 
持 字 符 的 推 人 和 弹出 ， 另 外 还 有 一 个 其 op 操作 可 以 读 取 栈 顶 的 字符 : 





>> stack = Stack.new(['a', 'b', 'c', 'd', 'e']) 
=> #<Stack (a)bcde> 


符 串 时 会 进入 


， 这 样 就 可 以 
， 因 此 这 次 只 











暴露 出 来 以 文 
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>> stack.top 

> a 

>> stack.pop.pop.top 
nen 


>> stack.push('x').push('y').top 


y 
>> stack.push('x').push('y').pop.top 
me 


这 仅仅 是 一 个 纯 功能 性 的 栈 。#push 和 #pop 方法 是 非 破坏 性 的 ， 它们 每 一 个 

心 都 返回 一 个 新 的 栈 实例 而 不 是 修改 已 有 的 栈 。 每 次 都 创建 一 个 新 的 栈 对 象 比 

ey 通常 拥有 破坏 性 #push 和 #pop 方法 操作 的 栈 (如 果 我 们 想 这 样 ， 可 以 直接 
使 用 Array) 效率 要 低 ， 但 是 使 用 起 来 要 更 容易 ， 因 为 在 多 处 使 用 一 个 Stack 
对 象 的 时 候 ， 我 们 不 必 担 心 对 其 进行 修改 的 后 果 。 





























第 3 章 里 ， 我 们 可 以 通过 只 跟踪 一 条 信息 来 模拟 确定 性 有 限 自动 机 ， 也 就 是 跟踪 DFA 的 
当前 状态 ， 然 后 在 每 次 从 输入 读 取 字 符 时 使 用 规则 手册 更 新 该 状态 。 但 是 关于 下 推 自动 机 
计算 的 每 一 步 有 两 件 重要 的 事情 要 知道 : 它 的 当前 状态 是 什么 ， 栈 的 当前 内 容 是 什么 。 如 
末 我 们 使 用 名 词 配 置 表示 一 个 状态 和 一 个 栈 的 组 合 ， 则 在 下 推 自 动机 读 取 输 入 字符 时 ， 我 
们 可 以 说 它 从 一 个 配置 转移 到 了 另 一 个 配置 ， 这 上 比 总 是 需要 分 别提 到 状态 和 栈 要 容易 。 从 
这 个 角度 看 的 话 ， 一 台 DPDA 只 会 有 一 个 当前 配置 ， 并 且 每 次 读 取 一 个 字符 时 规则 手册 都 
会 告诉 我 们 如 何 把 当前 配置 转换 成 下 一 个 配置 。 


下 面 是 用 来 存储 PDA 配置 〈 一 个 状态 和 一 个 栈 ) 的 一 个 PDAConflguration 类 ， 以 及 一 个 
用 来 表示 一 台 PDA 的 规则 手册 中 的 一 个 规则 的 PDARule 类 :5 




















class PDAConfiguration < Struct.new(:state, :stack) 
end 


class PDARule «< Struct.new(:state, :character, :next state, 
:pop_character, :push characters) 
def applies to?(configuration, character) 
self.state == configuration.state && 
self.pop character == configuration.stack.top && 
self.character == character 
end 
end 





只 有 在 机 器 状态 、 栈 顶 字 符 和 下 一 个 输入 的 字符 都 为 期 望 值 的 时 候 才能 应 用 规则 : 


>> rule = PDARule.new(1, '(', 2, '$', ['b', '$']) 
=> #<struct PDARule 
state=1, 














注 5: 因为 它们 的 实现 并 没有 做 任何 确定 性 的 假设 , 所 以 这 些 类 的 名 字 以 PDA 开头 ， 而 不 是 以 DPDA 开头 ， 
这 样 它们 在 模拟 非 确定 性 PDA 时 也 工作 得 很 好 。 




















character="(", 

next_ state=2, 

pop_character="$", 

push_characters=["b", "$"] 
> 


>> configuration = PDAConfiguration.new(1, Stack.new(['$'])) 
=> #<struct PDAConfiguration state=1, stack=#<Stack ($)>> 


>> rule.applies to?(configuration, '(') 
=> true 


对 一 台 有 限 自 动机 来 说 ， 遵 守 规 则 只 是 意味 着 从 一 个 状态 变 成 男 一 个 状态 ， 但 一 个 PDA 
规则 除了 改变 状态 之 外 还 会 更 新 栈 的 内 容 ， 因 此 PDARule#follow 需要 接受 机 器 的 当前 配置 





作为 参数 然后 返回 下 一 个 配置 : 





class PDARule 
def follow(configuration) 


PDAConfiguration.new(next_state, next stack(configuration)) 


end 


def next stack(configuration) 
popped_ stack = configuration.stack.pop 


push_characters.reverse. 





inject(popped stack) { |stack, character| stack.push(character) } 














>> stack = Stack.new(['$']).push('x').push('y').push('z') 


=> #<Stack (z)yx$> 
>> stack.top 
7 


>> stack = stack.pop; stack.top 


=> y 


>> stack = stack.pop; stack.top 


=> "Xx 











人 | 如果 我 们 把 一 些 字符 先 推 入 栈 中 然后 再 把 它们 弹出 ， 则 它们 出 来 时 的 顺序 会 
心 jh 与 之 前 的 顺序 相反 : 
0, 


PDARule#next_stack 通过 在 把 字符 推 人 栈 之 前 先 把 push_characters 反 转 的 办 
法 解决 这 个 问题 。 例 如 ，push_characters 的 最 后 一 个 字符 实际 上 是 推 入 栈 中 








的 第 一 个 字符 ， 这样 再 次 弹出 的 时 
方便 我 们 把 规则 的 push_characters 

















按照 字符 序列 读 取 (以 “弹出 的 





这 些 字符 序列 在 规则 应 用 之 后 会 出 
栈 顶 的 机 制 了 。 


因此 ， 如 果 把 一 个 PDARule 应 用 到 一 个 PDAConfiguration 上 ， 就 可 以 通过 这 个 规则 找 昌 


下 来 的 状态 和 栈 是 什么 样 的 : 


医 它 就 又 是 最 后 一 个 字符 了 。 这 只 是 为 了 


项 序 ”) ， 


现在 栈 顶 ， 这 样 我 们 就 不 用 关心 它们 到 达 
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>> rule.follow(configuration) 
=> #<struct PDAConfiguration state=2, stack=#<Stack (b)$>> 


这 足以 实现 DPDA 的 规则 手册 了 。 这 个 实现 与 3.1.4 市 的 DFARulebook 类 似 : 


class DPDARulebook < Struct.new(:rules 
def next_ configuration(configuration, character) 

rule for(configuration, character).follow(configuration) 

end 





def rule for(configuration, character 
rules.detect { |rule| rule.applies to?(configuration, character) } 
end 
end 


现在 我 们 可 以 为 平衡 括号 DPDA 汇编 一 个 规则 手册 了 ， 然 后 尝试 手工 单 步调 试 一 些 配置 和 
输入 字符 : 





>> rulebook = DPDARulebook.new([ 


PDARule.new(1, '(', 2, '$', ['b', '$']), 
PDARule.new(2, '(', 2, 'b', ['b', 'b']), 
PDARule.new(2, ')', 2, 'b', []), 
PDARule.new(2, nil, 1, '$', ['$']) 


]) 


=> #<struct DPDARulebook rules=[...]> 

>> configuration = rulebook.next configuration(configuration, '(') 
=> #<struct PDAConfiguration state=2, stack=#<Stack (b)$>> 

>> configuration = rulebook.next configuration(configuration, '(') 
=> #<struct PDAConfiguration state=2, stack=#<Stack (b)b$>> 

>> configuration = rulebook.next configuration(configuration, ')') 
=> #<struct PDAConfiguration state=2, stack=#<Stack (b)$>> 





为 了 代替 手工 操作 ， 我 们 可 以 使 用 规则 手册 构建 一 个 DPDA 对 象 ， 它 会 在 从 输入 读 取 字符 的 
同时 跟踪 机 器 的 当前 配置 ; 





Class DPDA < Struct.new(:current configuration, :accept states, :rulebook) 
def accepting? 
accept states.include?(current configuration. state) 
end 


def read character(character) 
self.current configuration = 
rulebook.next configuration(current configuration, character) 
end 


def read string(string) 
string.chars.each do |character| 
read character(character) 
end 
end 
end 





这 样 我 们 可 以 创建 一 个 DPDA， 提 供 输入 ， 然 后 看 它 是 否 能 够 接受 这 些 输入 : 


>> dpda = DPDA.new(PDAConfiguration.new(1, Stack.new(['$'])), [1], rulebook) 
=> #<struct DPDA ...> 

>> dpda.accepting? 

=> true 

>> dpda.read string('(()'); dpda.accepting? 

=> false 

>> dpda.current_ configuration 

=> #<struct PDAConfiguration state=2, stack=#<Stack (b)$>> 


到 目前 为 止 一 切 都 很 好 ， 但 我 们 正在 使 用 的 规则 手册 中 包含 一 个 自由 移动 ， 因 此 模拟 需要 
支持 自由 移动 以 便 正 确 工作 。 让 我 们 增加 一 个 DPDARulebook 的 辅助 方法 以 处 理 自由 移动 ， 
这 与 NFARulebook 中 的 类 似 (参见 3.2.2 节 ) : 


























class DPDARulebook 
def applies to?(configuration, character) 
lrule for(configuration, character).nil? 
end 


def follow free moves(configuration) 
if applies to?(configuration, nil) 
follow free moves(next configuration(configuration, nil)) 
else 
configuration 
end 
end 
end 





DPDARulebook#follow_free_moves 将 不 断 地 反复 执行 能 应 用 到 当前 配置 的 任何 自由 移动 ， 
直到 没有 自由 移动 的 时 候 才 会 停止 : 


>> configuration = PDAConfiguration.new(2, Stack.new(['$'])) 
=> #<struct PDAConfiguration state=2, stack=#<Stack ($)>> 
>> rulebook.follow free moves(configuration) 

=> #<struct PDAConfiguration state=1, stack=#<Stack ($)>> 

















在 我 们 的 状态 机 实验 中 ， 这 是 首次 在 模拟 中 引入 了 有 可 能 的 无 限 循环 。 只 
一 EE》 有 个 自由 移动 链 ， 且 它 的 开始 和 结束 状态 相同 ， 就 会 有 循环 。 最 简单 的 例 
子 是 存在 一 个 根本 不 改变 配置 的 自由 移动 ， 


>> DPDARulebook.new([PDARule.new(1, nil, 1, '$', ['$'])]). 
follow free moves(PDAConfiguration. new (1 Stack.new(['$']))) 
SystemStackError: stack level too deep 


这 些 无 限 循环 毫 无 用 处 ， 因 此 我 们 在 设计 下 推 自 动机 的 时 候 要 注意 避免 它们 。 



























































我 们 还 需要 封装 DPDA#current_configuration 的 默认 实现 ， 以 便利 用 规则 手册 对 自由 移动 
的 支持 : 
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class DPDA 
def current configuration 
rulebook.follow free moves(super) 
end 
end 


现在 我 们 有 了 可 以 启动 、 接 受 字符 输入 并 且 检 查 是 否 接受 输入 的 DPDA 模拟 了 : 


>> dpda = DPDA.new(PDAConfiguration.new(1, Stack.new(['$'])), [1], rulebook) 
=> #<struct DPDA ...> 

>> dpda.read string('(()('); dpda.accepting? 

=> false 

>> dpda.current configuration 

=> #<struct PDAConfiguration state=2, stack=#<Stack (b)b$>> 

>> dpda.read string('))()'); dpda.accepting? 

=> true 

>> dpda.current_configuration 

=> #<struct PDAConfiguration state=1, stack=#<Stack ($)>> 


如 果 把 此 模拟 像 往常 一 样 封 装 进 DPDADesign， 我 们 就 可 以 很 容易 地 根据 需要 检查 字符 串 : 


class DPDADesign < Struct.new(:start state, :bottom character, 
:accept states, :rulebook) 
def accepts?(string) 
to dpda.tap { |dpda| dpda.read string(string) }.accepting? 
end 


def to dpda 
start stack = Stack.new([bottom character]) 
start configuration = PDAConfiguration.new(start state, start stack) 
DPDA.new(start configuration, accept states, rulebook) 
end 
end 


不 出 所 料 ， 我 们 的 DPDA 可 以 识别 任意 舱 套 深度 的 平衡 括号 组 成 的 复杂 字符 串 : 


>> dpda_design = DPDADesign.new(1, '$', [1], rulebook) 
=> #<struct DPDADesign ...> 


>> dpda_design.accepts?(' ((((((((C ON)))') 


=> true 


>> dpda_design.accepts?('() (CO))((O)) OO ') 


=> true 


>> dpda_design.accepts?(' (OO)OO TOON OY)') 


=> false 








还 有 最 后 一 个 细节 要 注意 。 输 入 后 DPDA 处 于 有 效 状态 时 ， 我 们 的 模拟 运行 得 很 完美 ， 但 


在 机 器 卡 住 的 时 候 它 就 会 出 问题 了 : 


>> dpda design.accepts?('())') 
NoMethodError: undefined method ‘follow' for nil:NilClass 


之 所 以 会 发 生 这 种 情况 ， 是 因为 DPDARulebook#next_configuration 假设 它 总 能 





找到 可 用 的 





规则 ， 因 此 在 没有 规则 可 用 的 时 候 我 们 不 应 该 调用 它 。 修 改 DPDA#read_character 检查 可 
用 规则 ， 如 果 没 有 可 用 规则 ， 就 把 DPDA 置 于 一 个 无 法 转移 出 去 的 阻塞 状态 ， 这 样 我 们 就 
解决 了 这 个 问题 : 





class PDAConfiguration 
STUCK_STATE = Object.new 


def stuck 
PDAConfiguration.new(STUCK_STATE, stack) 
end 


def stuck? 
state == STUCK_ STATE 
end 
end 


class DPDA 
def next configuration(character) 
if rulebook.applies to?(current configuration, character) 
rulebook.next configuration(current configuration, character) 
else 
current configuration.stuck 
end 
end 


def stuck? 
current configuration.stuck? 
end 


def read character(character) 
self.current configuration = (next configuration(character)) 
end 


def read string(string) 
string.chars.each do |character| 
read character(character) unless stuck? 
end 
end 
end 


现在 DPDA 会 优雅 地 阻塞 住 而 不 会 月 江 了 : 





>> dpda = DPDA.new(PDAConfiguration.new(1, Stack.new(['$'])), [1], rulebook) 
=> #<struct DPDA ...> 

>> dpda.read string('())'); dpda.current configuration 

=> #<struct PDAConfiguration state=#<0bject>, stack=#<Stack ($)>> 

>> dpda.accepting? 

=> false 

>> dpda.stuck? 

=> true 

>> dpda design.accepts?('())') 

=> false 
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4.2 非 确定 性 下 推 目 动机 


尽管 处 理 平 衡 括号 问题 的 机 器 确实 需要 栈 来 完成 工作 ， 但 它 其 实 只 是 将 栈 作 为 一 个 计数 
器 ， 并 且 它 的 规则 只 区 分 “ 栈 为 室 ” 和 “ 栈 不 为 空 ”。 更 复杂 的 DPDA 将 会 把 一 种 以 上 的 


符号 推 入 栈 中 ， 


并 在 执行 计算 时 使 用 这 些 信 息 。 一 个 简单 的 例子 是 一 台 机 器 ， 它 能 识别 包 


含 相等 数目 的 两 种 字符 的 字符 串 ， 比 如 a 和 b: 


a;a/aa 

b;b/bb 
a;b/ 
b;a/ 


ai$/ay 
-0 b;$/b$ 


我 们 的 模拟 表明 它 能 完成 工作 : 


>> rulebook = DPDARulebook. new([ 


PDARule.new(1, 'a'’, 2, '$', ['a', '$']), 
PDARule.new(1, 'b', 2, '$', ['b', '$']), 
PDARule.new(2, 'a', 2, 'a', ['a', 'a']), 
PDARule.new(2, 'b', 2, 'b', ['b', 'b']), 
PDARule.new(2, 'a', 2, 'b', []), 
PDARule.new(2, 'b', 2, 'a', []), 
PDARule.new(2, nil, 1, '$', ['$']) 
]) 

=> #<struct DPDARulebook rules=[...]> 

>> dpda design = ee new(1, '$', [1], rulebook) 

=> #<struct DPDADesign ... 





>> pd eol een en bal 


=> true 


>> dpda_design.accepts?('bbbaaaab') 


=> true 


>> dpda_design.accepts?('baa') 


=> false 


这 与 平衡 括号 的 机 器 类 似 ， 只 是 它 的 行为 由 栈 顶 字符 控制 。a 在 栈 顶 意味 着 机 器 已 经 看 到 
a 过 剩 了 ， 因 此 任何 额外 从 输入 读 取 的 a 将 会 在 栈 中 累积 ， 而 每 读 到 一 个 b 就 会 从 栈 中 弹 
出 一 个 a 作为 抵 销 ， 反 之 ， 栈 顶 是 b 时， 就 是 b 在 累积 而 用 a 来 抵 销 。 


即使 是 这 个 DPDA 也 没有 利用 栈 的 全 部 优点 。 在 栈 顶 字符 之 下 没有 它 感 兴趣 的 任何 历史 
数据 ， 只 有 一 些 无 意义 的 a 或 bp， 因 此 我 们 可 以 只 把 一 种 字符 推 入 栈 (也 就 是 说 还 是 把 它 
当 作 一 个 简单 的 计数 器 )， 并 使 用 两 个 不 同 的 状态 区 分 “对 过 剩 的 a 计数 ”和 “对 过 剩 的 b 





计数 ”"， 这 样 也 能 得 到 同样 的 结果 : 





























-ake 
b;c/ 








为 了 真正 开发 出 栈 的 潜能 ， 我 们 需要 一 个 更 难 的 问题 强迫 我 们 存储 结构 化 信息 。 经 典 的 例 
子 是 识别 回 文字 符 串 : 随 着 一 个 字符 一 个 字符 地 读 取 输 入 字符 串 ， 我 们 需要 记 住所 看 到 的 
数据 ， 一旦 字符 串 读 取 过 了 一 半 ， 就 要 检查 内 存 以 确定 之 前 看 到 的 字符 是 否 为 当前 呈现 字 
符 的 逆序 。 下 面 这 个 DPDA 能 够 识别 一 个 回 文字 符 串 ， 这 个 字符 串 由 字符 a 和 6b 组 成 ,并 
且 在 中 间 的 位 置 有 一 个 字符 m (表示 中 间 位 置 ) : 











a;$/as$ 
a;a/aa 
a;b/ab 
b;$/b$ 
b;a/ba a;a/ 
b;b/bb m;$/$  b;b/ 


m;a/a 
m;b/b 局 $/$ CG) 


这 台 机 器 从 状态 1 开始， 不断 从 输入 读 取 a 和 b， 然 后 把 它们 推 入 栈 中 。 它 读 到 m 的 时 候 ， 
会 转移 到 状态 2， 在 那里 一 直 读 取 输 入 字符 同时 尝试 把 每 一 个 字符 都 弹出 栈 。 如 果 字 符 串 后 
半 部 分 的 每 一 个 字符 都 与 栈 中 弹出 的 内 容 匹 配 ， 机 器 就 停留 在 状态 2 并 最 终 碰 到 栈 底 的 $， 
此 时 转移 到 状态 3 并 接受 这 个 输入 字符 串 。 处 于 状态 2 的 时 候 ， 如 果 读 入 的 任何 字符 与 栈 
顶 的 字符 不 匹配 ， 那 就 没有 规则 可 以 遵守 ， 因 此 它 将 进入 阻塞 状态 并 拒绝 这 个 字符 串 。 





我 们 可 以 模拟 这 台 DPDA 检查 它 的 工作 情况 : 


>> rulebook = DPDARulebook.new([ 
PDARule.new(1, 'a'’, 1, '$', ['a', '$']), 
PDARule.new(1, 'a', 1, 'a', ['a', 'a']), 
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PDARule.new(1， 'a' 
PDARule.new(1, 'b 
PDARule.new(1, 'b 
PDARule.new(1, 'b' 
1 m 

m 

m 


~- 


- 


- 


~- 


PDARule.new(1,' 
PDARule.new(1,' 
PDARule.new(1,' 
PDARule.new(2, 'a' 
PDARule.new(2,'b', 
PDARule.new(2, nil, 


- 


vv -vv uv 
-~ 


- 


- 
TY TY ATY HAT 





ODO OoOPAPPPPp 


~- 
入 ”和 


]) 


=> #<struct DPDARulebook rules=[...]> 
>> dpda_ design = DPDADesign.new(1, '$', [3], 
=> #<struct DPDADesign ...> 

>> dpda_design.accepts?('abmba') 

=> true 

>> dpda_design.accepts?('babbamabbab') 
=> true 

>> dpda_design.accepts?('abmb') 

=> false 

>> dpda_design.accepts?('baambaa') 

=> false 








肛 好 ， 但 是 输入 字符 串 中 间 的 m 是 一 种 逃避 。 
别 回 文字 符 串 


[Ee 
一 








rulebook) 


我 们 为 什么 不 能 设计 一 台 机 器 ， 让 它 能 识 


aa、abba、babbaabbab 等 一 一 但 无 需 在 中 间 插 入 一 个 标记 呢 ? 








机 器 在 到 达 字 符 串 的 中 间 位 置 时 需要 从 状态 1 转移 到 状态 2， 而 没有 标记 的 话 ， 就 没 法 知道 





什么 时 候 做 这 样 的 状态 转移 。 就 像 我 们 之 前 处 型 


E NFA 时 看 到 的 那样 ， 这 种 “我 怎么 知道 什 








么 时 候 该 ……” 的 问题 可 以 通过 放松 确定 性 约束 并 允许 机 器 在 任意 时 间 都 可 以 做 重要 的 状 
态 转 移 来 解决 ， 这 样 它 就 可 能 通过 在 正确 的 时 间 遵 照 正确 的 规则 接受 一 个 回 文字 符 串 。 





3 








不 出 所 料 的 是 ， 没 有 确定 性 约束 的 下 推 自动 机 叫 作 非 确 定性 下 推 自动 机 (nondeterministic 


pushdown automaton) 。 下 面 是 一 台 能 识别 由 偶数 个 字母 组 成 的 回 文字 符 串 的 非 确定 性 下 推 











自动 机 “: 


aj$/ag 
a;a/aa 
a;b/ab 
b;$/b$ 
b;a/ba a; 
b;b/bb $/$ b; 








注 6:“ 偶 数 个 字母 ”的 约束 能 让 机 器 保持 简单 : 一 个 长 度 是 2n 的 回 文字 符 串 可 以 通过 先 把 n 个 字符 推 入 栈 
然后 再 把 n 个 字符 弹出 栈 来 接受 。 为 了 识别 任意 的 回 文字 符 串 ,需要 从 状态 1 到 状态 2 之 间 多 一 些 规则 。 



































除 本 站 态 了 到 状态 2 科 现 荐 ， 这 和 DPDA 的 版 本 是 一 样 的 : 在 DPDA 中 ， 它 们 从 输入 读 
取 m， 但 这 里 是 自由 移动 。 这 让 NPDA 有 机 会 在 输入 字符 串 的 时 候 改 变 状态 ， 而 不 再 需要 


标记 了 。 


4.2.1 模拟 
一 台 非 确定 性 机 器 要 比 一 人 台 确 定性 机 器 更 刀 
困难 的 部 分 ， 因 此 可 以 在 处 理 NPDA 时 重用 同 相 

它 的 实现 也 几乎 和 NFARulebook 完全 一 样 


存 一 个 PDARule 的 非 确 定性 集合 ， 





模拟 ， 但 我 们 在 3.2.1 节 中 已 经 完成 了 NFA 中 
要 一 个 NPDARulebook 来 保 














司 样 的 思想 。 我 们 需 


no 














require “Set 

class NPDARulebook < Struct.new(:rules) 

def next configurations(configurations, character) 
configurations.flat map { |config| follow rules for(config, character) }.to set 


end 
def follow rules for(configuration, character) 
rules for(configuration, character).map { |rule| rule.follow(configuration) } 


end 
def rules for(configuration, character) 
rules.select { |rule| rule.applies to?(configuration, character) } 
end 
end 
在 3.2.1 市 中 ， 我 们 通过 跟踪 可 能 状态 的 集合 来 模拟 一 台 NFA， 这 里 会 通过 
次 几乎 与 NFARulebook 的 实现 一 致 





合 来 模拟 一 台 NPDA。 
我 们 的 规则 手册 需要 支持 自由 移动 ， 


class NPDARulebook 
def follow free moves(configurations) 
next_configurations(configurations, nil) 





more_configurations | 
if more configurations.subset?(configurations) 


configurations 
follow free moves(configurations + more configurations) 


else 
end 
end 
end 
需要 一 个 NPDA 类 来 封装 一 个 规则 手册 
:accept states, :rulebook) 


在 当前 配置 的 集合 之 外 ， 我 们 
class NPDA < Struct.new(:current configurations, 
current configurations.any? { |config| accept states.include?(config.state) } 





def accepting? 


end 
def read character(character) 


寸 可 能 配置 的 集 
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self.current configurations = 
rulebook.next configurations(current configurations, character) 
end 


def read string(string) 
string.chars.each do |character| 
read character(character) 
end 
end 


def current configurations 
rulebook.follow free moves(super) 
end 
end 


这 让 我 们 可 以 随 着 每 个 字符 的 读 入 单 步 模拟 出 所 有 可 能 的 配置 ; 





>> rulebook = NPDARulebook.new([ 

PDARule.new(1, 'a'’, 1, '$', ['a'’,' 
PDARule.new(1, 'a'’, 1, 'a', [ 
PDARule.new(1, 'a'’, 41, 'b', ['a',' 
PDARule.new(1, 'b', 1 
PDARule.new(1, 'b', 1 
PDARule.new(1, 'b', 1 [ 
PDARule.new(1, nil, 2, '$', ['$']), 
PDARule.new(1, nil, 2 [ 
PDARule.new(1, nil, 2 
PDARule.new(2, 'a', 2 
PDARule.new(2, 'b', 2 
PDARule.new(2, nil, 3 





]) 


=> #<struct NPDARulebook rules=[...]> 

>> configuration = PDAConfiguration.new(1, Stack.new(['$'])) 
=> #<struct PDAConfiguration state=1, stack=#<Stack ($)>> 
>> npda = NPDA.new(Set[configuration], [3], rulebook) 

=> #<struct NPDA ...> 

>> npda.accepting? 





=> true 
>> npda.current configurations 
=> #<Set: { 


#<struct PDAConfiguration state=1, stack=#<Stack ($)>>, 
#<struct PDAConfiguration state=2, stack=#<Stack ($)>>, 
#<struct PDAConfiguration state=3, stack=#<Stack ($)>> 
}> 
>> npda.read string('abb'); npda.accepting? 
=> false 
>> npda.current_configurations 
=> #<Set: { 
#<struct PDAConfiguration state=1, stack=#<Stack (b)ba$>>, 
#<struct PDAConfiguration state=2, stack=#<Stack (a)$>>, 
#<struct PDAConfiguration state=2, stack=#<Stack (b)ba$>> 
}> 
>> npda.read character('a'); npda.accepting? 
=> true 


So 





>> npda.current configurations 
=> #<Set: { 
#<struct PDAConfiguration state=1, stack=#<Stack 
#<struct PDAConfiguration state=2, stack=#<Stack 
#<struct PDAConfiguration state=2, stack=#<Stack 
#<struct PDAConfiguration state=3, stack=#<Stack 
}> 


a)bba$>>， 
$)>>， 
a)bba$>>， 
$)>> 


ri ey 





最 后 用 一 个 NPDADesign 类 直接 测试 字符 串 ， 


Hd 


class NPDADesign < Struct.new(:start state, :bottom character, 
:accept states, :rulebook) 
def accepts?(string) 
to npda.tap { |npda| npda.read string(string) }.accepting? 
end 


def to npda 
start stack = Stack.new([bottom character]) 
start configuration = PDAConfiguration.new(start state, start stack) 
NPDA.new(Set[start configuration], accept states, rulebook) 
end 
end 


现在 可 以 检查 一 下 NPDA 是 否 确实 可 以 识别 回 文字 符 串 : 


>> npda_design = NPDADesign.new(1, '$', [3], rulebook) 
=> #<struct NPDADesign ...> 

>> npda_design.accepts?('abba') 

=> true 

>> npda_design.accepts?('babbaabbab') 

=> true 

>> npda_design.accepts?('abb') 

=> false 

>> npda_design.accepts?('baabaa') 

=> false 


看 起 来 很 好 啊 ! 非 确 定性 明显 已 经 给 了 我 们 确定 性 机 器 所 不 具备 的 识别 语言 的 能 


4.2.2 不 等 价 


但 是 等 一 等 : 我们 在 3.4 节 中 看 到 ， 没 有 栈 的 非 确定 性 机 器 在 能 力 上 与 确定 性 机 器 是 等 价 
的 。 我 们 用 Ruby 模拟 的 NFA 行为 像 是 一 台 DFA (它们 都 是 随 着 从 输入 读 取 字符 在 有 限 
个 “模拟 状态 ”中 转移 )， 可 以 把 任意 一 台 NFA 转换 成 接受 同样 字符 的 DFA。 那 么 非 确定 
性 真 的 能 带 给 我 们 额外 的 能 力 ， 还 是 Ruby 模拟 的 NPDA 只 是 行为 类 似 DPDA 呢 ? 是 否 存 
在 一 个 算法 能 把 任意 的 非 确 定性 下 推 自动 机 转换 成 确定 性 下 推 自动 机 呢 ? 


答案 是 不 存在 。NFA 到 DFA 的 小 把 戏 能 成 功 ， 是 因为 我 们 可 以 使 用 一 个 DFA 状态 表示 
多 个 可 能 的 NFA 状态。 为 了 模拟 一 台 NFA， 我 们 只 需要 跟踪 现在 它 可 能 处 于 的 状态 ， 然 
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后 每 次 读 取 一 个 输入 字符 就 选 一 个 不 同 的 可 能 状态 集合 ， 这 样 如 果 给 它 设 定 正确 的 规则 ， 
DFA 就 可 以 轻松 完成 工作 。 


但 这 个 小 把 戏 不 适用 于 PDA: 我 们 不 能 有 效 地 把 多 重 NPDA 配置 表示 成 一 个 DPDA 配置 。 
并 不 奇怪 ， 问 题 出 在 栈 的 上 面 。 一 个 NPDA 模拟 需要 知道 当前 能 出 现在 栈 顶 的 所 有 字符 ， 
而 且 它 必须 能 同时 从 几 个 模拟 的 栈 弹 出 和 推 入 。 无 法 把 所 有 可 能 的 栈 组 合成 一 个 栈 ， 以 便 
DPDA 仍 能 看 到 所 有 的 栈 顶 字符 并 可 以 单独 访问 每 个 可 能 的 栈 。 我 们 用 Ruby 写 一 个 程序 
做 所 有 这 些 并 不 难 ， 但 是 DPDA 没有 足够 的 能 力 来 处 理 。 
































所 以 不 幸 的 是 ， 我 们 的 NPDA 模拟 的 行为 并 不 像 一 台 DPDA， 也 不 存在 NDPA 到 DPDA 
的 算法 。 无 标记 的 回 文 问题 就 是 这 样 一 个 例子 ，NPDA 能 完成 这 个 问题 ,但 DPDA 不 能 ， 
因此 非 确定 性 下 推 自动 机 确实 比 确 定性 的 能 力 要 强 。 


4.3 ”使 用 下 推 目 动机 进行 分 析 


3.3 节 展 示 了 如 何 用 非 确定 性 有 限 自 动机 实现 正则 表达 式 匹 配 。 下 推 自 动机 也 有 一 个 重要 
的 实际 应 用 : 它们 能 用 来 解析 编程 语言 。 














在 2.6 节 中 ， 我 们 已 经 看 到 如 何 使 用 Treetop 为 一 部 分 Simple 语言 构建 解析 器 。Treetop 解 
析 器 使 用 解析 表达 式 语法 来 描述 被 解析 语言 的 完整 语法 ， 但 这 是 一 个 相当 现代 的 思想 。 更 
传统 的 方式 是 把 解析 过 程 分 成 两 个 独立 的 阶段 。 





。 词法 分 析 
读 取 一 个 原始 字符 串 然后 把 它 转 换 成 一 个 单词 oken 序列 。 每 一 个 单词 token 代表 程序 
语法 的 一 个 组 成 部 分 ， 例 如 “变量 名 ”、“ 左 括号 ”或 者 “while 关键 字 "。 词 法 分 析 器 使 
用 称 为 词法 的 规则 集合 来 决定 什么 样 的 字符 应 该 产生 什么 样 的 单词 。 这 个 阶段 处 理 杂乱 
的 字符 级 别 的 细节 ， 比 如 变量 命名 规则 、 注 释 和 空格 ， 它 为 下 一 阶段 的 处 理 准备 好 清楚 
的 单词 序列 。 






































。 语法 分 析 
读 入 一 个 单词 序列 并 根据 正在 分 析 的 语言 语法 判断 它们 是 否 代表 一 个 有 效 的 程序 。 如 果 
程序 有 效 ， 那 么 语法 解析 器 会 生成 一 些 关于 程序 结构 的 附加 信息 (如 一 个 解析 树 )。 








4.3.1 词法 分 析 

词法 分 析 阶 段 通 常 相当 直接 。 这 可 以 通过 正则 表达 式 实 现 (因而 也 就 是 通过 一 台 NFA 实 
现 )， 因 为 它 把 字符 序列 与 一 些 规则 简单 匹配 以 判断 那些 字符 是 否 为 关键 字 、 变 量 名 、 运 
算 符 或 者 其 他 什么 符号 。 下 面 是 一 些 快速 但 是 不 整洁 的 Ruby 代码 ， 可 以 把 一 个 Simple 程 
序 断 成 单词 : 
































class LexicalAnalyzer < Struct.new(:string) 


GRAMMAR = [ 
{ token: 'i', pattern: /if/ },，## if 关键 字 
{ token: 'e', pattern: /else/ },，# else 关键 字 
{ token: 'w', pattern: /while/ },，# while 关键 字 
{ token: 'd', pattern: /do-nothing/ }, # do-nothing 关键 字 
{ token: '(', pattern: /\(/ }，# 左 小 括号 
{ token: ')', pattern: /\)/ }，# 右 小 括号 
{ token: '{', pattern: /\{/ }，# 左 大 括号 
{ token: '}', pattern: /\}/ }，# 右 大 括号 
{ token: ';', pattern: /;/ }，## 分 号 
{ token: '=', pattern: /=/ }，## 等 号 
{ token: '+', pattern: /\+/ }， 多 加 号 
{ token: '*', pattern: /\*/ }，# 乘 号 
{ token: '<', pattern: /</ }，## 小 于 号 
{ token: 'n', pattern: /[0-9]+/ }，# 数字 
{ token: 'b',，pattern: /true|false/ }, # 布尔 值 
{ token: 'v', pattern: /[a-z]+/ } 多 变量 名 

















] 


def analyze 
[].tap do |tokens| 
while more tokens? 
tokens.push(next token) 
end 
end 
end 


def more tokens? 
lstring.empty? 
end 


def next token 
rule, match = rule matching(string) 
self.string = string after(match) 
rulel[ :token] 

end 


def rule matching(string) 


matches = GRAMMAR.map { |rule| match at beginning(rule[:pattern], string) } 
rules with matches = GRAMMAR.zip(matches).reject { |rule, match| match.nil? } 





rule with longest match(rules with matches) 
end 


def match at beginning(pattern, string) 
/\A#{pattern}/.match(string) 
end 


def rule with longest match(rules with matches) 


rules with matches.max by { |rule, match| match.to s.length } 


end 


def string after(match) 
match.post match.1lstrip 
end 


end 
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号 一 这 个 实现 使 用 单个 字符 作为 单词 一 w 的 意思 是 “while 关键 字 ”，+ 的 意思 
人 心 4 、 是 “加 号 ”， 以 此 类 推 一 因为 我 们 准备 把 这 些 单词 提供 给 PDA， 而 我 们 


[SN 


~ Ruby 模拟 的 PDA 期 望 以 字符 作为 输入 。 

















字面 值 。 但 是 在 真正 的 解析 器 里 ， 我 们 就 需要 合适 的 数据 结构 表示 单词 ， 这 
样 它们 才能 在 传达 “ 某 个 不 知名 的 变量 ”或 “ 某 个 未 知 的 布尔 值 ”之 外 包 
更 多 的 信息 。 


单字 符 的 单词 足以 应 付 基本 的 演示 需要 了 ， 这 里 我 们 不 需要 保留 变量 名 或 者 

















通过 使 用 Simple 代码 组 成 的 字符 串 创 建 LexicalAnalyzer 实例 ， 然 后 调用 它 的 #analyze 方 
法 ， 我 们 可 以 获得 一 个 由 单词 组 成 的 数组 ， 这 个 数组 说 明了 如 何 把 代码 断 成 关键 字 、 运 算 
符 、 标 点 以 及 其 他 语法 : 


>> LexicalAnalyzer， new(" y =X * 7').analyze 


= * Vv" 2 人 Vv" 2 0 ‘nN "] 

>> LexicalAnalyzer. new(' i (x < 5) { 让 ). 人 

= 区 w" 要 人 'v" 人 EA 0 全 人 学 "v" 2; SS 'v" 2 We | 

>> LexicalAnalyzer.new(" 人 < 10) {y= true; x = 0 } else do- ps ) ).analyze 
ee get Pe Ds Sg 5 
ts de 


泣 羽 


词法 分 析 要 按照 最 长 匹配 选择 规则 进行 ， 否 则 会 造成 变量 名 被 错误 地 识别 为 





心 关键 字 : 
ney 
、 >> LexicalAnalyzer.new('x = false').analyze 
=> Ls "a "Bb"] 
>> LexicalAnalyzer.new('x = falsehood').analyze 
ey [Vs 人 "v"] 


解决 这 个 问题 还 有 其 他 的 方法 。 一 种 就 是 在 规则 中 使 用 限制 性 更 强 的 正则 表 
达 式 : 如 果 布 尔 值 的 规则 使 用 模式 /(true|false)(?![a-z])/， 那 它 就 不 会 首 
先 匹 配 字符 串 “falsehood' 了。 





4.3.2 ”语法 分 析 


把 字符 串 转 成 单词 之 后 ， 难 一 些 的 问题 就 是 确定 这 些 单词 是 否 表示 一 个 语法 有 效 的 Simple 
程序 了 。 我 们 不 铺 # 使 用 正则 表 这 式 或 者 NFA 一 一 Simple 的 语法 允许 任意 的 括号 垦 套 ， 而 我 
们 已 经 知道 有 限 自动 机 的 能 力 不 足 以 识别 这 样 的 语言 。 但 是 使 用 下 推 自动 机 是 可 以 识别 单 
词 的 有 效 序列 的 ， 所 以 下 面 来 看 看 如 何 构 造 一 台 下 推 自动 机 。 





首先 ， 我 们 需要 一 个 语法 描述 单词 如 何 组 合 形成 程序 。 下 面 是 基于 2.6 节 中 Treetop 语法 结 
构 的 一 部 分 Simple 语法 : 


< 语句 > ::= <while> | < 赋值 > 





<while> := W' ，'(' 《< 表达 式 >》')' '{' 《< 语句 > '}' 
“赋值 > := 'vV' "=' < 表达 式 > 

“表达 式 > :=《 小 于 表达 式 > 

< 小 于 表达 式 、::= 《< 乘 >'<' < 小 于 表达 式 >| < 乘 > 

<“ 乘 > :=《 名 词 > '*#'《“ 乘 >|“ 名 词 > 

< 名 词 > 人 


这 叫 作 上 下 文 无 关 文 法 〈(Context-Free Grammar，CFG)。 每 一 条 规则 的 左边 是 一 个 符号 ， 
<while> | < 赋值 > 的 意思 是 
一 个 Simple 语句 要 么 是 while 循环 要 么 是 一 个 赋值 ， 而 “赋值 ::= '“v" '-' 《表达 式 > 的 


右边 是 一 个 或 多 个 符号 序列 和 单词 。 例 如 ， 规 则 < 语句 > ::= 














意思 是 一 个 赋值 语句 由 一 个 变量 名 后 面 跟 上 一 个 等 号 和 一 个 表达 式 组 成 。 


CFG 是 一 个 Simple 结构 的 静态 描述 ， 但 我 们 把 它 看 成 一 个 生成 Simple 程序 的 规则 集合 。 
从 “语句 >” 开 始 ， 我 们 应 用 文法 规则 递归 展开 符号 直到 只 剩 下 单词 为 止 。 下 面 是 根据 规 























则 完全 展开 “< 语句 >” 的 方式 之 一 : 


“语句 > 一 《赋值 > 

一 "= < 表达 式 > 
一 'v，'="' < 小 于 表达 式 > 
一 'vV '=' 《< 乘 > 
一 'V' '=' 《名词 >》'*' < 乘 > 
一 vv = 'V '*' < 乘 > 
一 vv = 'V'， '*' < 名词 > 
eV eV 

这 表明 vv = Yo 在 语法 上 有 效 ， 但 我 们 要 的 是 相反 方向 的 能 力 : 能 识别 有 效 





的 程序 ， 而 不 是 生成 它们 。 在 由 词法 分 析 得 到 一 串 单词 的 时 候 ， 我 们 想 要 知道 是 否 可 以 按 
照 某 种 顺序 应 用 文法 规则 把 “< 语句 >” 扩展 成 这 些 单词 。 垃 好 ， 有 办 法 把 上 下 文 无 关 文法 





转换 成 能 做 出 这 种 判断 的 非 确 定性 下 推 自动 机 。 
把 一 个 CFG 转换 成 PDA 的 方法 如 下 。 





(1) 选取 一 个 字符 表示 文法 中 的 每 个 符号 。 在 这 种 情况 下 ， 我 们 使 用 每 个 符号 的 大 写 首 字 
母 一 一 表示“ 语句 >”, 表示 <while>， 以 此 类 推 一 一 这 是 为 了 与 我 们 已 经 用 来 作为 





单词 的 小 写字 符 区 分 开 。 
(0) 使 用 PDA 的 栈 存储 表示 文法 符号 的 字符 (5、W、A、E 





…) 和 单词 (w、v、=、*、 





ee ) 。PDA 启动 的 时 候 ， 立 即 把 一 个 符号 推 入 栈 中 ， 这 个 符号 表示 它 正 在 试图 识别 的 
结构 。 我 们 想 要 识别 Simple 语句 ， 所 以 PDA 开始 时 要 把 5 推 入 栈 中 : 


>> start rule = PDARule.new(1, nil, 2, '$', ['S', '$']) 
=> #<struct PDARUle ...> 











单词 ， 它 总 是 包含 一 个 变量 名 、 赋 值 符号 和 表达 式 。 不 是 所 有 的 语 
所 有 的 编程 语言 都 可 以 。 





i 


已 











注 7: 文法 是 “上 下 文 无 关 的 ” 指 它 的 规则 没有 提 到 文法 可 能 出 现 的 上 下 文 ， 一 个 赋值 语句 不 管 周围 是 什么 








都 可 以 用 这 种 文法 描述 ， 但 几乎 
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(3) 把 文法 规则 转换 成 无 需 任何 输入 就 能 扩展 栈 顶 符号 的 PDA 规则 。 








一 个 文法 规则 描述 


了 如 何 把 一 个 符号 扩展 成 由 其 他 符号 和 单词 组 成 的 序列 ， 而 和 加 有 城下 述 转换 


成 一 个 PDA 规则 ， 











>> Symbol rules = [ 


# <statement> ::= 




















= while> / Cassign> 





它 把 一 个 代表 特定 符号 的 字符 弹出 栈 并 把 其 他 字符 推 入 栈 中 : 





PDARule.new(2, nil, 2, 'S', ['W']), 
PDARule.new(2, nil, 2, 'S', ['A']), 
# <while> ::= 人 '(' «expression> ')' '{' «statement> 人 
PDARule.new(2, nil, 2, 'W', ['w', '(', 'E’, ')', '{', 'S', '}']), 
# assign> ::= 'V' '=' ¢expression> 
PDARule.new(2, nil, 2, 'A', ['v', '='", 'E']), 
# expression> ::= ¢less-than> 
PDARule.new(2, nil, 2, 'E', ['L']), 
# ¢less-than> ::= multiply> '¢' ¢less-than> | <multiply> 
PDARule.new(2, nil, 2, 'L', ['M', '<', 'L']), 
PDARule.new(2, nil, 2, 'L', ['M']), 
# cmultiply> ::= <term> '*' cmultiply> | <term> 
PDARule.new(2, nil, 2, 'M', [TT se Ms 
PDARule.new(2, nil, 2, 'M', ['T']), 
# <term> := ‘nf 'v’ 
PDARule.new(2, nil, 2, 'T', ['n']), 
PDARule.new(2, nil, 2, 'T', ['v']) 
=> [#<struct PDARule ...>, #<struct PDARule ...>, ...] 
例如 ， 赋 值 语 名 的 规则 说 的 是 “< 赋值 >” 符 号 可 以 扩展 成 单词 v、= 以 及 后 面 的 “< 表 


达 式 >” 


V=E。 


换 ， 而 另 一 条 


(4) 为 每 一 个 单词 符号 赋予 一 个 PDA 规则 ， 


lt nnd 符号 规则 试 


=> [#<struct PDARule .. 


符 写 ， 因 此 我 们 有 一 个 对 应 的 PDA 规则 ， 
“< 语句 >” 规则 说 的 是 我 们 可 以 把 “< 语句 >” 
换 ， 我 们 已 经 把 它 转换 成 了 一 个 PDA 规则 ， 

规则 是 把 Ss 从 弹出 然后 推 入 A。 


这 个 规则 从 输入 读 取 字 符 然 后 把 它 从 栈 中 弹出 : 








>> token rules = LexicalAnalyzer::GRAMMAR.map do |rulel| 


PDARule.new(2, rule[:token], 2, rule[:token], []) 


end 





(5) 最 后 ， 生 成 一 个 PDA 规则 ， 


.>, #<struct PDARule ...>, ...] 


总 是 让 栈 更 小 ， 








它 可 以 自发 地 从 栈 中 弹出 A 并 推 人 字符 
符号 用 一 个 while> 或 者 “赋值 > 和 替 
它 把 一 个 5S 从 栈 中 弹出 ， 然 后 用 一 个 W 奉 








图 让 栈 变 大 ， 有 时候 会 推 入 一 些 
随 着 栈 的 变 小 处 理 输入 。 





在 栈 变 成 空 时 它 允 许 机 器 进入 接收 状态 : 





>> 
三 六 


stop rule = PDARule.new(2, nil, 3, '$', ['$']) 
#<struct PDARuUle ...> 








现在 我 们 可 以 使 用 这 些 规则 构建 一 台 PDPA， 输 入 一 个 由 单词 组 成 的 字符 串 看 它 是 否 能 够 识 
别 。 由 Simple 语法 生成 的 规则 是 非 确 定性 的 (每 当 字符 5S、L、M 或 者 T 处 于 栈 顶 的 时 候 ， 
就 会 有 多 个 可 用 的 规则 ) ， 因 此 它 只 能 是 一 台 NPDA。 


>> 
= 
>> 
=> 
zy 
Gd 
>> 
=> 
>> 
= 





rulebook = NPDARulebook.new([start rule, stop rule] + symbol rules + token rules) 
#<struct NPDARulebook rules=[...]> 

npda_design = NPDADesign.new(1, '$', [3], rulebook) 

#<struct NPDADesign ...> 

token string = LexicalAnalyzer.new('while (x < 5) { x = x * 3 }').analyze.join 
"w(v<n){v=v*n}" 

npda_ design.accepts?(token string) 

true 

npda_design.accepts?(LexicalAnalyzer.new('while (x < 5 x = x * }').analyze.join) 
false 


为 了 准确 地 表示 整个 过 程 ， 下 面 是 向 这 台 NPDA 输入 字符 串 'w(v<n){v=v*n}' 后 的 一 个 可 























能 执行 : 

状态 是 否 接受 栈 的 内 容 剩余 输入 动作 

1 否 w(v<n){v=v*n} 推 人 5， 转移 到 状态 2 
2 否 S$ w(v<n){v=v*n} 弹出 S, 推 信 W 

2 否 W w(v<n){v=v*n} 弹出 W， 推 入 w(E){5} 
2 否 w(E){S} w(v<n){v=v*n} 读 取 w， 弹 出 w 

2 否 (E){S} (v<n){v=v*n} 读 取 (， 弹 出 ( 

2 否 E){S}$ v<n){v=v*n} 弹出 E， 推 入 上 

2 否 L){S} v<n){v=v*n} 弹出 L， 推 入 MKL 
2 否 M<L){S} v<n){v=v*n} 弹出 M， 推 入 T 

2 否 T<L){S} v<n){v=v*n} 弹出 T， 推 入 v 

2 否 v<L){S} v<n){v=v*n} 读 取 v， 弹 出 v 

2 否 <L){S} <n){v=v*n} 读 取 <， 弹 出 < 

2 否 L){S} n){v=v*n} 弹出 L， 推 人 1 

2 否 ){S} n){v=v*n} 弹出 M， 推 人 T 

2 否 T){S} n){v=v*n} 弹出 T， 推 人 n 

2 否 n){S} n){v=v*n} 读 取 n,， 弹出 n 

2 否 ){S} ){v=v*n} 读 取 )， 弹 出 ) 

2 否 5} {v=v*n} 读 取 {， 弹 出 { 

2 否 35} v=v*n} 弹出 Ss， 推 入 A 

2 否 Aj$ v=v*n} 弹出 A， 推 入 v=E 
2 否 v=E} v=v*n} 读 取 v， 弹 出 v 

2 否 =E} =v*n} 读 取 =， 弹出 = 

2 否 E} v*n} 弹出 E， 推 人 上 
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状态 是 否 接受 栈 的 内 容 剩余 输入 动作 

2 痊 L} v*n} 弹出 L， 推 入 M 

2 否 } v*n} 弹出 M， 推 入 T*M 
2 各 T*M} v*n} 弹出 T， 推 人 V 

2 在 v*M} v*n} 读 取 v， 弹 出 v 

2 否 *M} *n} 读 取 *， 弹 出 * 

2 否 } n} 弹出 M， 推 信 T 

2 否 1} n} 弹出 T, 推 入 n 

2 否 n} n} 读 取 n， 弹出 n 

2 入 } } 读 取 }， 弹 出 } 

2 否 转移 到 3 

3 是 = 

这 个 执行 过 程 的 跟踪 向 我 们 展示 了 机 器 在 符号 和 单词 规则 之 间 的 摇摆 : 符号 规则 不 断 地 扩 





展 栈 顶 符号 ， 直到 此 符号 被 一 个 单词 取代 ， 然 后 单词 规则 再 对 栈 (和 输入 ) 进行 处 理 ， 
直到 遇 到 一 个 符号 为 止 。 只 要 输入 字符 串 能 够 由 文法 规则 生成 ， 这 样 的 反复 就 能 得 到 一 个 
空 栈 。 3 
在 每 一 步 执行 中 PDA 是 怎么 知道 选择 哪个 规则 的 呢 ? 这 是 非 确定 性 的 力量 : 我 们 模拟 
的 NPDA 对 所 有 可 能 的 规则 进行 尝试 ， 因 此 只 要 存在 某 种 方式 能 得 到 空 栈 ， 我 们 就 能 找 
到 它 。 














4.3.3 ”实践 性 

这 个 分 析 的 过 程 依赖 于 非 确定 性 ， 但 在 实际 程序 中 ， 最 好 能 避免 非 确定 性 ， 因 为 一 个 确定 
性 的 PDA 模拟 起 来 要 比 非 确定 性 的 快 得 多 而 且 容 易 得 多 。 幸 运 的 是 ， 在 每 个 阶段 几乎 都 
可 以 使 用 输入 单词 本 身 决定 该 应 用 哪个 符号 规则 ， 这 样 就 可 能 把 非 确定 性 去 掉 一 一 这 个 技 
术 叫 作 递 推 (lookahead) 一 一 但 这 让 从 CFG 到 PDA 的 转换 更 为 复杂 。 




















只 能 识别 有 效 程序 也 不 够 好 。 就 像 我 们 在 2.6 节 看 到 的 那样 ， 解 析 一 个 程序 的 要 领 就 是 把 
程序 转 成 一 个 能 用 来 做 一 些 有 用 事情 的 结构 化 表示 。 在 实践 中 ， 我 们 可 以 让 PDA 模拟 记 
录 它 到 达 接 受 状态 过 程 中 的 规则 序列 ， 以 此 来 创建 结构 化 表示 ， 这 个 规则 序列 提供 了 构建 
一 个 分 析 树 所 需 的 足够 信息 。 例 如 ， 上 面 的 执行 序列 展示 了 为 了 形成 需要 的 单词 序列 如 何 
展开 栈 顶 的 符号 ， 并 且 告 诉 了 我 们 字符 串 'w(v<n){v=v*n}" 的 解析 树 形状 : 
































注 8: 这 个 算法 叫 作 LL 分 析 。 第 一 个 工 代 表 “ 从 左 到 右 ”， 因 为 输入 字符 串 是 按 这 个 方向 读 取 的 ， 第 二 个 
L 代表 “ 左 侧 优先 推导 ， 因 为 总 是 栈 中 最 左边 的 〈 也 就 是 最 上 面 的 ) 符号 得 到 扩展 。 
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4.4 有 多 少 能 力 


在 这 一 章 中 ， 我 们 见 到 了 两 个 新 的 计算 能 力 的 级 别 : DPDA 比 DFA 和 NFA 更 强大 ， 而 
NPDA 要 比 DPDA 更 强大 。 能 访问 栈 之 后 ， 看 起 来 下 推 自动 机 比 有 限 自 动机 要 强大 和 复杂 


一 些 。 























拥有 栈 的 主要 结果 就 是 能 识别 某 些 有 限 自 动机 不 能 识别 的 语言 了 ， 如 回 文 和 平衡 括号 字符 
串 。 栈 提供 的 无 限 存储 使 PDA 能 在 计算 中 记 住 任意 数量 的 信息 并 在 随后 再 次 使 用 它 。 





与 有 限 自 动机 不 同 ，PDA 可 以 在 没有 任何 输入 的 情况 下 无 限 循环 ， 这 虽然 不 是 很 有 用 ， 但 
是 比较 少见 。DFA 只 能 通过 处 理 输入 字符 来 改变 状态 ， 而 NFA 尽管 可 以 自发 地 通过 自由 
移动 改变 状态 ， 但 它 只 能 在 回 到 起 点 之 前 进行 有 限 次 数 的 自由 移动 。 另 一 方面 ，PDA 可 以 
保持 在 一 个 状态 并 不 断 地 把 字符 推 人 栈 中 ， 永 远 也 不 会 重复 同样 的 配置 。 




















在 某 种 程度 上 ， 下 推 自 动机 还 能 控制 自己 。 在 规则 和 栈 之 间 有 一 个 反馈 环 一 一 栈 的 内 容 影 
响 机 器 应 该 遵守 的 规则 ， 而 按照 某 个 规则 执行 也 会 影响 栈 的 内 容 一 一 这 允许 PDA 在 栈 中 
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存储 一 些 信 息 ， 这 些 信息 可 以 影响 它 将 来 的 执行 。 有 限 自动 机 依赖 于 类 似 的 规则 和 当前 状 
态 之 间 的 反馈 ， 但 这 个 反馈 作用 要 小 一 些 ， 因 为 当前 状态 在 改变 之 后 就 完全 被 遗忘 了 ， 而 
把 字符 推 入 栈 中 可 以 把 老 的 内 容 保 存 起 来 供 以 后 使 用 。 


因此 PDA 确实 是 要 强大 一 些 ， 但 它 的 限制 是 什么 呢 ? 即使 我 们 只 对 看 到 的 模式 匹配 应 用 
感 兴趣 ， 下 推 自动 机 仍然 严重 受 限 于 栈 的 工作 方式 。 在 栈 顶 字符 之 下 的 内 容 没 有 办 法 随 
机 访问 ， 因 此 如 果 机 器 想 要 读 取 埋 在 栈 中 间 的 一 个 字符 ， 就 得 弹出 这 个 字符 上 面 所 有 的 
东西 。 一 旦 字符 被 弹出 ， 就 永远 消失 了 。 我 们 设计 了 一 台 PDA 以 识别 由 等 量 的 a 和 b 组 
成 的 字符 串 ， 但 没 法 修改 它 以 识别 由 等 量 的 三 种 字符 组 成 的 字符 串 ('abc' 、'aabbcc'、 
"aaabbbccc'……)， 因 为 关于 a 的 数量 的 信息 在 对 b 计数 的 过 程 中 被 破坏 了 。 


撤 开 能 用 的 向 栈 中 推送 字符 的 次 数 ， 栈 的 后 进 先 出 属性 也 会 引起 信息 存储 和 获取 的 问题 。 
PDA 能 识别 回 文 ， 但 它 不 能 识别 'abab' 和 'baaabaaa' 这 样 “ 双 倍 ” 的 字符 串 ， 因 为 一 旦 
信息 被 推 入 到 栈 中 ， 就 只 能 以 相反 的 顺序 处 理 了 。 


如 果 我 们 抛 开 识 别 字 符 串 的 特定 问题 ， 而 把 这 些 机 器 看 成 通用 目的 的 计算 机 ， 就 可 以 看 到 
DFA、NFA 和 PDA 还 远 远 不 够 有 有 用。 首先， 它们 都 没有 像样 的 输出 机 制 : 它们 通过 进入 
接受 状态 表达 成 功 ， 但 不 能 输出 哪怕 一 个 字符 〈 更 不 用 说 由 字符 组 成 的 字符 串 了 ) 来 表示 
详细 的 结果 。 无 法 将 信息 发 送 回 世界 意味 着 它们 连 把 两 个 数 相 加 这 样 的 简单 算法 都 实现 不 
了 。 而 像 有 限 自 动机 一 样 ，PDA 有 一 个 固定 的 程序 ， 没 有 明显 的 方法 构建 出 一 台 PDA 能 
以 某 种 方式 从 输入 读 取 一 个 程序 然后 运行 。 


所 有 这 些 缺 点 意味 着 我 们 需要 一 个 更 好 的 计算 模型 ， 去 真正 地 研究 计算 机 能 干什么 ， 而 这 
正 是 下 一 章 的 内 容 。 







































































第 5 章 


终极 机 器 





在 第 3 章 和 第 4 章 ， 我们 研究 了 简单 计算 模型 的 能 力 。 我 们 已 经 看 到 如 何 识别 复杂 性 逐渐 
增加 的 字符 串 、 如 何 匹 配 正则 表达 式 ， 以 及 如 何 解析 编程 语言 ， 而 且 都 是 使 用 不 太 复 杂 的 
基本 机 器 完成 的 。 








但 我 们 也 看 到 ， 这 些 机 器 一 一 有 限 自 动机 和 下 推 自动 机 一 一 都 有 很 严格 的 限制 ， 这 些 限制 
影响 了 它们 作为 现实 计算 模型 的 使 用 。 我 们 的 小 型 系统 还 要 多 强大 ， 才 能 摆脱 这 些 限 制 并 
完成 正常 计算 机 的 所 有 工作 呢 ? 它 还 要 多 复杂 才能 对 RAM 或 硬盘 的 行为 以 及 合适 的 输出 
机 制 建 模 呢 ? 怎么 才能 设计 一 台 能 实际 运行 程序 而 不 总 是 执行 某 个 硬 编码 任务 的 机 器 呢 ? 








20 世纪 30 年 代 ， 阿 兰 ， 图 灵 (Alan Turing) 致力 于 从 本 质 上 解决 这 个 问题 。 在 那个 年 代 ， 
单词 computer 意味 着 一 个 人 ， 通 常 是 一 个 女人 ， 她 手工 重复 着 一 系列 繁重 的 数学 性 操作 以 
执行 长 长 的 计算 。 图 灵 当 时 正在 寻找 一 种 理解 和 描述 “人 肉 计算 机 ”操作 特征 的 方法 ， 这 
样 同样 的 工作 就 可 以 完全 由 机 器 执行 。 本 章 ， 我 们 将 看 到 图 灵 关 于 设计 最 简单 的 “自动 化 
机 器 ”的 思想 ， 这 一 机 器 具有 手工 计算 的 全 部 能 力 和 复杂 性 。 


Pom 
5.1 确定 型 图 灵机 
在 第 4 章 ， 我 们 通过 给 一 台 有 限 自动 机 赋予 一 个 作为 外 部 存储 的 栈 ， 增 强 了 它 的 计算 能 
力 。 与 由 机 器 状态 提供 的 有 限 内 部 存储 相 比 ， 栈 的 真正 优点 是 能 动态 增长 以 适应 任意 数量 
的 信息 ， 从 而 使 下 推 自动 机 能 够 处 理 那 些 需 要 存储 任意 数量 数据 的 问题 。 
但 是 ， 外 部 存储 这 种 特殊 的 形式 给 如 何 使 用 存储 之 后 的 数据 带 来 了 限制 。 通 过 把 栈 替 换 成 
更 灵活 的 存储 机 制 ， 我 们 可 以 消除 这 些 限制 并 进一步 提高 能 
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5.1.1 存储 

计算 通常 可 以 通过 在 纸 上 写 某 些 符 号 完成 。 我 们 可 以 把 这 张 纸 想象 成 小 朋友 的 算 
本 本 ， 它 被 划分 成 了 一 个 个 方 格 。 在 初等 算术 里 ， 我 们 有 时 也 会 使 用 纸 的 二 维特 
性 。 但 这 种 使 用 通常 是 可 以 避免 的 ， 并 且 我 认为 纸 的 二 维 性 不 是 计算 的 本 质 ， 而 
且 相 信 大 家 也 赞同 我 这 一 观点 。 我 假定 计算 是 在 一 张 一 维 的 纸 上 完 成 的 ， 比 如 在 

一 条 分 成 方 格 的 纸 带 上 完成 。 
一 一 阿兰 .图 灵 ,《 论 可 计算 数 及 其 在 判定 性 问题 上 的 应 用 》， 
http://dx.doi.org/10.1112/plms/s2-42.1.230 


图 灵 的 做 法 是 给 一 台 机 器 配 上 一 条 无 限 长 的 空 纸 带 (实际 上 是 一 个 两 端 都 能 随 需 增长 的 一 
维 数组 )， 并 且 允 许 在 纸 带 上 的 任意 位 置 读 写 字符 。 一 条 纸 带 既 做 存储 又 做 输入 : 可 以 在 
纸 带 上 预先 填 满 字符 串 当 作 输入 ， 然 后 机 器 在 执行 过 程 中 可 以 读 取 这 些 字符 并 在 必要 的 时 
候 覆 盖 它 们 。 


能 访问 一 条 无 限 长 纸 带 的 有 限 状 态 自 动机 叫 作 图 灵机 (Turing Machine，TM )。 这 个 
名 字 通 常 指 一 条 拥有 确定 性 规则 的 机 器 ， 但 我 们 也 可 以 毫 无 起 义 地 叫 它 确定 型 图 灵机 
(Deterministic Turing Machine, DTM ) 。 


我 们 已 经 知道 ， 下 推 自动 机 只 能 访问 其 外 部 存储 的 一 个 固定 位 置 ( 栈 的 顶部 )， 但 这 似乎 
对 图 灵机 来 说 限制 性 太 强 了 。 提 供 一 条 纸 带 的 目的 就 是 允许 在 纸 带 上 的 任何 位 置 存 储 任意 
量 的 数据 ， 并 以 任意 顺序 读 取 ， 那 么 我 们 如 何 设计 一 台 能 与 整 条 纸 带 交互 的 机 器 呢 ? 


一 种 选择 是 让 纸 带 可 以 被 随机 寻 址 访问 ， 就 像 计算 机 的 RAM 一 样 给 每 个 方 格 标记 一 个 独 
立 的 数字 地 址 ， 这 样机 器 可 以 立即 读 取 和 写 入 任何 位 置 。 这 增加 了 不 必要 的 复杂 性 ， 而 且 
需要 规划 出 细节 上 的 东西 ， 比 如 如 何 给 一 条 无 限 纸 带 的 所 有 方 格 分 配 地 址 ， 以 及 在 它 需 要 
访问 方 格 时 如 何 指定 方 格 的 地 址 。 


传统 的 图 灵机 不 是 这 样 ， 而 是 使 用 更 简单 的 安排 : 用 一 个 纸 带 头 (tape head) 指向 纸 带 的 
一 个 特定 位 置 ， 并 且 只 能 在 那个 位 置 读 取 或 写 和 字符。 每 一 步 计算 之 后 ， 纸 带头 都 可 以 向 
左 或 者 向 右 移 动 一 个 方 格 ， 这 意味 着 一 台 图 灵机 为 了 到 达 远 处 的 位 置 只 能 费力 地 在 纸 带 上 
往复 移动 。 使 用 移动 缓慢 的 纸 带 头 不 会 影响 机 器 访问 纸 带 上 任何 数据 的 能 力 ， 只 会 影响 花 
费 的 时 间 ， 因 此 为 了 保持 简单 付出 这 个 代价 是 值得 的 。 


能 访问 纸 带 之 后 ， 除 了 能 够 接受 或 者 拒绝 字符 串 ， 我 们 又 能 解决 新 的 问题 了 。 例 如 ， 我 们 
可 以 设计 一 台 在 纸 带 上 就 地 递增 一 个 二 进 制 数 的 DTM。 为 此 ， 我 们 需要 知道 如 何 递增 一 
个 二 进 制 数 的 一 位 数字 。 幸 好 这 很 简单 : 如 果 这 位 的 数字 是 0， 就 用 1 替换 ， 如 果 这 位 数 
是 1， 就 用 0 替换 ， 然 后 立即 使 用 同样 的 方法 增加 它 左 边 的 数字 〈( 进 1 位 ”")。 图 灵机 只 需 
要 使 用 这 个 过 程 递 增 二 进 制 数 的 最 右 位 ， 然 后 把 纸 带 头 移 到 起 始 位 置 。 


。 给 机 器 赋予 三 个 状态 (状态 1、 状 态 2、 状 态 3)， 状 态 3 作为 接受 状态 。 
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。 机 器 从 状态 1 开始 ， 纸 带头 指向 一 个 二 进 制 数 的 最 右 位 。 





。 处 于 状态 1 并 且 读 到 一 个 0 (或 者 空白 ) 时 ， 就 用 1 履 写 ， 把 纸 带 头 向 右 移 ， 然 后 回 到 


状态 2。 
。 处 于 状态 1 并 且 读 到 一 个 1 时， 就 用 0 履 写 ， 然 后 把 纸 带头 向 左 移 。 
。 处 于 状态 2 并 且 读 到 一 个 0 或 者 1 时 ， 就 把 纸 带 头 向 右 移 。 
。 处 于 状态 2 并 且 读 到 空白 时 ， 就 把 纸 带 头 向 左 移 并 转移 到 状态 3。 





下 











下 











在 机 器 试图 递增 一 位 数字 的 时 候 ， 它 处 于 状态 1， 在 移 回 起 始 位 置 时 处 于 状态 2， 结 束 的 


时 候 处 于 状态 3。 下 面 是 初始 纸 带 上 字符 串 为 “1011 时 对 机 器 执行 的 跟踪 。 纸 带头 当前 指 











向 的 字符 会 由 括号 包围 ， 而 下 划 线 表示 和 输入 字符 串 某 一 端的 空白 方 格 。 





状态 是 否 接受 纸 带 内 容 动作 

1 [2 _101(1) 写 和 人 0， 左 移 

1 否 _ 10(1)0_ 写 和 人 0， 左 移 

如 1(0)00 写 入 1， 右 移 ， 转 移 到 2 
2 将 _11(0)0_ 右 移 

2 六 _110(0) 右 移 

2 否 1100(_) 左 移 ， 转 移 到 状态 3 

3 是 _110(0) 一 











严格 来 说 ， 把 纸 带 头 移 回 它 的 初始 位 置 并 不 必要 (如果 我 们 把 状态 2 作为 接 
心 。 受 状态 ， 则 一 旦 机 器 成 功 地 把 0 替换 成 1， 它 会 立即 停止 ， 而 纸 带 仍 会 包含 
”正确 的 结果 )， 但 这 是 一 个 值得 要 的 特性 ， 因 为 它 把 纸 带头 放 到 位 之 后 ， 机 
器 只 要 简单 地 把 状态 改变 回 状态 1 就 可 以 再 次 运行。 通过 多 次 运行 机 器 ， 我 
们 可 以 不 断 递增 存储 在 纸 带 上 的 数 。 这 个 功能 可 以 重用 ， 作 为 更 大 机 器 的 一 
部 分 ， 比 如 说 把 两 个 二 进 制 数 相 加 或 相 乘 。 























5.1.2 ”规则 


让 我 们 想象 一 下 ， 由 机 器 执行 的 操作 被 分 解 成 “简单 的 操作 ”， 这 些 操作 者 非常 
基本 ,以 至 于 无 法 想象 它们 能 进一步 分 解 。…… 操作 实际 上 是 由 计算 者 的 思维 状 
态 和 被 观察 的 符号 决定 的 …… 具 体 来 讲 ， 操 作 执 行 之 后 ， 计 算 者 的 思维 状态 就 确 
定 了 也。 


我 们 现在 可 以 构造 一 台 做 这 种 计算 者 工作 的 机 器 了 。 
一 一 阿兰 图 灵 ,《 论 可 计算 数 及 其 在 判定 性 问题 上 的 应 用 》 











在 每 一 步 计 算 中 ， 可 能 都 有 几 个 “简单 的 操作 ”需要 图 灵机 执行 : 在 纸 带 头 的 当前 位 置 读 


取 字 符 ， 在 那个 位 置 写 和 一 个 新 字符 ， 把 纸 带头 左 移 或 者 右 移 ， 或 者 改变 状态 。 简 单 起 
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见 ， 我 们 没有 为 所 有 这 些 动作 指定 不 同 种 类 的 规则 ， 而 只 是 像 处 理 下 推 自动 机 时 那样 ， 只 
设计 了 一 种 能 灵活 适应 各 种 条 件 的 规则 格式 。 


这 个 统一 的 规则 格式 有 5 部 分 : 


。 机 器 的 当前 状态 ; 

。 必须 出 现在 纸 带 头 当 前 位 置 的 字符 ， 

。 机 器 的 下 一 状态 ; 

。 要 写 入 纸 带 头 当 前 位 置 的 字符 ， 

。 写 入 纸 带 之 后 纸 带 头 的 移动 方向 (向 左 还 是 向 右 )。 











这 里 我 们 假设 一 台 图 灵机 每 次 执行 规则 ， 都 要 改变 状态 并 向 纸 带 写 一 个 字符 。 就 像 通常 对 
状态 机 的 处 理 那样 ， 如 果 我 们 想 要 一 个 规则 不 实际 改变 状态 ， 可 以 让 “下 一 个 状态 ”与 当 
前 状态 相同 ， 与 之 类 似 的 是 ， 如 果 想 要 一 个 规则 不 改变 纸 带 内 容 ， 可 以 把 与 读 到 的 字符 一 
样 的 字符 写 入 纸 带 。 











我 们 还 假设 了 纸 带 头 每 步 都 要 移动 。 这 就 不 太 可 能 书写 一 个 不 移动 纸 带头 就 
心 。 更 新 状态 或 者 纸 带 内 容 的 规则 ， 但 我 们 可 以 通过 一 个 规则 做 出 需要 的 改变 以 


[7% 


得 到 同样 的 效果 ， 然 后 再 通过 一 个 规则 把 纸 带 头 移 回 原始 位 置 。 























递增 一 个 二 进 制 数 的 图 灵机 写成 这 种 类 型 的 话 将 有 6 个 规则 : 


。 处 于 状态 1 并 且 读 入 一 个 0 时 ， 写 和 一 个 1， 右 移 ， 然 后 进入 状态 2; 

。 处 于 状态 1 并 且 读 入 一 个 1 时 ， 写 入 一 个 0， 左 移 ， 然 后 保持 在 状态 1; 
。 处 于 状态 1 并 且 读 到 一 个 空白 时 ， 写 入 一 个 1， 右 移 ， 然 后 进入 状态 2; 
。 处 于 状态 2 并且 读 到 一 个 0 时 ， 写 入 一 个 0， 右 移 ， 然 后 保持 在 状态 2; 
。 处 于 状态 2 并 且 读 入 一 个 1 时 ， 写 入 一 个 1， 右 移 ， 然 后 保持 在 状态 2; 
。 处 于 状态 2 并 且 读 到 一 个 空白 时 ， 写 入 一 个 空白 ， 左 移 ， 然 后 进入 状态 3。 


与 在 有 限 自动 机 和 下 推 自动 机 中 使 用 的 图 类 似 ， 我 们 也 可 以 展示 机 器 的 状态 和 规则 : 

















0/0;R 
1/0;L 1/1;R 
0/1;R 


es 和 a G) 


事实 上 ， 除 去 箭头 上 的 标签 ， 这 很 像 一 个 DFA 示意 图 。 标 签 a/b;L 表示 一 条 规则 ， 它 从 纸 
带 上 读 取 字 符 a， 写 入 字符 b， 然 后 把 纸 带头 向 左 移动 一 个 方 格 ; 标签 a/b;R 表示 的 规则 几 
平一 样 ， 只 是 会 把 纸 带头 向 右 而 不 是 向 左 移动 。 






































我 们 看 一 下 如 何 使 用 图 灵机 解决 下 推 自动 机 无 法 处 理 的 字符 串 识别 问题 ， 要 识别 的 字符 串 
包含 一 个 或 者 多 个 字符 a， 后面 跟随 着 同样 数目 的 b 和 c (如 'aaabbbccc')。 解 决 这 个 问题 
的 图 灵机 有 6 个 状态 和 16 个 规则 : 

















它 大 致 像 这 样 工 作 : 


(1) 通过 不 断 把 纸 带 头 向 右 移 扫描 输入 字符 串 ， 直 到 发 现 一 个 a 为止， 然后 通过 用 X 替换 a 
来 把 它 删除 (状态 1) ， 

(2) 向 右 扫 描 寻 找 一 个 bp， 然后 删除 (状态 2) ， 

(3) 向 右 扫描 寻找 一 个 c， 然 后 pe (状态 3) ， 

(4) 向 右 扫描 寻找 输入 字符 串 的 结尾 〈 状 态 4) ， 然 后 向 左 扫描 寻找 输入 字符 串 的 开头 〈 状 
态 5) ; 


(5) 重复 这 些 步 又， 直到 所 有 的 字符 都 已 被 删除 为 止 。 
如 果 输 入 字符 串 是 由 一 个 或 多 个 字符 a 以 及 同样 数目 的 b 和 < 组 成 的 ， 那么 机 器 将 会 重复 


跨越 整个 字符 串 几 次 ， 每 次 跨越 都 会 删除 一 个 字符 ， 然 后 在 整个 字符 串 都 被 删 掉 的 时 候 进 
入 到 一 个 接受 状态 。 下 面 是 在 输入 为 “aabpcc 时 的 执行 跟踪 。 























状态 是 否 接受 纸 带 内 容 动作 

1 否 (a)abbcc_ 写 入 X， 右 移 ， 转 移 到 状态 2 
2 否 XxX(a)bbcc 右 移 

2 否 __ Xa(b)pcc _ 写 人 X， 右 移 ， 转 移 到 状态 3 
3 否 Xax(b)cc 右 移 

3 否 Xaxb(c)c 写 入 X， 右 移 ， 转 移 到 状态 4 
4 否 XaXbxX(c) 右 移 

4 加 Xaxbxc( ) 左 移 ， 转 移 到 状态 5 

5 否 XaXbX(c) 左 移 
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交 




















状态 是 否 接受 纸 带 内 容 动作 
5 否 _ XaXb(X)c 左 移 
5 否 XaxX(b)Xc 左 移 
5 否 Xa(X)bXc 左 移 
5 否 Xx(a)XbXc 左 移 
5 否 _(X)aXbxXc_ 左 移 
5 否 __ ( )XaXbxc 右 移 ， 转 移 到 状态 1 
否 (X)aXbXc_ 右 移 
1 否 _  X(a)XbXxc 写 入 XY， 右 移 ， 转 移 到 状态 2 
2 否 XX(X)bXc 右 移 
2 否 __ XXX(b)Xc 写 和 人 X， 右 移 ， 转 移 到 状态 3 
3 否 XXXX(X)c 右 移 
3 否 _XXXXX(c) 写 入 X， 右 移 ， 转 移 到 状态 4 
4 否 XXXXXX(_) 左 移 ， 转 移 到 状态 5 
5 否 _XXXXX(X) 左 移 
5 否 XXXX(X)X 左 移 
5 否 _ XXX(X)XX 左 移 
5 否 XX(X)XXX 左 移 
5 否 XCX)XXXX__ 左 移 
5 否 (XXXXXX_ 左 移 
5 否 (CD)XXXXXX 右 移 ， 转 移 到 状态 1 
否 (X)XXXXX_ 右 移 
否 XX)XXXX__ 右 移 
否 XX(X)XXX 右 移 
否 XXX(X)XX 右 移 
否 XXXX(X)X 右 移 
否 _XXXXX(X) 右 移 
否 XXXXXX( ) 左 移 ， 转 移 到 状态 6 
6 是 _XXXXX(X) = 
这 台 机 器 能 够 工作 是 因为 扫描 阶段 规则 的 准确 选择 。 例 如 ， 机 器 处 于 状态 3 (向 右 扫 描 并 





查找 c) 的 时 候 ， 它 能 执行 的 规则 只 能 是 移动 纸 带 头 经 过 b 和 X。 如 果 机 器 遇 到 了 其 他 字 


符 (如 非 其 
止 执 行 ， 并 


-> 














望 的 3)， 它 是 没有 规则 可 以 遵守 的 ， 在 这 种 情况 下 它 会 进入 隐 含 的 卡 死 状态 停 
会 因此 拒绝 这 个 输入 。 














我 们 通过 假设 输入 只 包含 字符 a、b 和 < 来 保持 简单 ， 但 如 果 不 是 这 样 ， 机 器 也 
` 会 正常 工作 。 例 如 ， 它 会 接受 字符 串 'XaXXpXXXc' ， 即 使 这 个 字符 串 本 来 应 该 
被 拒绝 。 为 了 正确 地 处 理 这 种 输入 ， 我 们 需要 增加 更 多 的 规则 和 状态 扫描 整个 字 
符 串 ， 以 检查 在 机 器 开始 删除 字符 之 前 这 个 字符 串 不 包含 任何 非 期 望 的 字符 。 























130 | 第 


5 章 


5.1.3 ”确定 性 
对 于 设计 成 确定 性 的 一 台 特 定 的 图 灵机 ， 它 只 能 遵守 和 确定 性 下 推 自 动机 一 样 的 约束 ( 参 
见 4.1.3 节 )， 但 这 次 我 们 不 用 担心 自由 移动 ， 因 为 图 灵机 没有 自由 移动 。 


要 根据 图 灵机 的 当前 状态 和 当前 纸 带 头 下 的 字符 来 选择 它 的 下 一 个 动作 ， 因 此 一 台 确 定性 
机 器 只 能 有 由 状态 和 字符 组 合成 的 一 个 规则 一 一 “无 矛盾 ”规则 ， 这 是 为 了 避免 下 一 个 动 
作 有 任何 的 歧义 。 简 单 起 见 ， 我 们 会 像 处 理 DPDA 时 那样 ， 放 松 “ 无 遗漏 ”规则 ， 并 假设 
在 没有 规则 可 用 的 时 候 机 器 可 以 进入 一 个 隐 含 的 卡 死 状 态 ， 而 不 是 坚持 对 于 每 一 个 可 能 的 
情况 都 要 有 一 个 规则 。 















































5.1.4 模拟 
我 们 已 经 对 一 台 确 定性 图 灵机 应 该 如 何 工作 有 了 很 好 的 认识 ， 现 在 来 构建 一 个 Ruby 的 模 
拟 以 便 可 以 看 到 它 的 执行 。 




















一 步 是 实现 图 灵机 的 纸 带 。 很 显然 这 个 实现 不 得 不 存储 写 到 纸 带 上 的 字符 ， 但 它 还 需要 
记 住 纸 带 头 的 当前 位 置 ， 以 便 模 拟 出 来 的 机 器 可 以 读 取 当 前 字符 ， 在 当前 位 置 写 人 一 个 新 
的 字符 ， 并 左右 移动 纸 带头 到 达 其 他 位 置 。 


做 到 这 一 点 的 一 个 优雅 方式 是 把 纸 带 分 成 三 部 分 〈 纸 带头 左边 的 全 部 字符 、 纸 带头 下 的 一 
个 字符 、 i 部 分 分 别 存储 。 这 让 读 写 当前 字符 变 得 非常 容易 ， 而 移 
动 纸 带 头 可 以 通过 在 所 有 三 个 部 分 之 间 慢 慢 移动 字符 实现 。 例 如 ， 向 右 移 动 一 个 方 格 ， 意 
二 一 个 字符 ， 而 之 前 纸 带 头 右边 的 第 一 个 字符 
成 为 了 当前 字符 。 


我 们 的 实现 还 必须 维护 纸 带 无 限 长 而 且 填 满 空白 方 格 的 假象 ， 但 幸好 并 不 需要 一 个 无 限 大 
a 在 任意 给 定时 刻 唯 一 能 被 读 取 的 是 纸 带 头 下 的 位 置 ， 因 此 在 纸 带 头 移动 超出 

经 写 在 纸 带 上 的 有 限 数目 的 非 空 字符 时 。 我 们 只 需 安 排 一 个 空白 字符 出 现 。 为 此 ， 我 
人 个人 个 空白 方 格 ， 然 后 只 要 进入 到 纸 带 上 未 经 探索 的 区 域 ， 就 
可 以 让 这 个 字符 自动 出 现在 纸 带 头 下 。 


因此 ， 一 条 纸 带 的 基本 表示 看 起 来 像 这 样 : 






























































class Tape < Struct.new(:left, :middle, :right, :blank) 
def inspect 
"#<Tape #{left.join}(#{middle})#{right.join}>" 
end 
end 


因此 可 以 创建 一 条 纸 带 并 读 取 纸 带头 下 面 的 字符 : 
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>> tape = Tape.new(['1', '0', '1'], '1', [], '_') 
=> #<Tape 101(1)> 

>> tape.middle 

= 





我 们 可 以 增加 操作 ， 向 当前 纸 带 位 置 ， 写 和 并 把 纸 带头 左右 移动 : 


class Tape 
def write(character) 
Tape.new(left, character, right, blank) 
end 


def move head left 
Tape.new(left[0..-2], left.last || blank, [middle] + right, blank) 
end 


def move head right 
Tape.new(left + [middle], right.first || blank, right.drop(1), blank) 
end 
end 


现在 可 以 向 纸 带 写 入 ， 并 来 回 移动 纸 带 头 : 








>> tape 

=> #<Tape 101(1)> 

>> tape.move head left 

=> #<Tape 10(1)1> 

>> tape.write('0') 

=> #<Tape 101(0)> 

>> tape.move head right 

=> #<Tape 1011( )> 

>> tape.move head right.write('0') 
=> #<Tape 1011(0)> 








在 第 4 章 ， 我 们 使 用 配置 一 词 来 代表 下 推 自 动机 状态 和 栈 的 组 合 ， 同 样 的 理念 在 





会 
很 有 帮助 。 可 以 说 一 个 图 灵机 的 配置 是 一 个 状态 和 一 条 纸 带 的 组 合 ， 并 且 可 以 直接 处 理 这 














些 配置 的 图 灵机 规则 : 





class TMConfiguration < Struct.new(:state, :tape) 
end 


class TMRule < Struct.new(:state, :character, :next state, 
:write character, :direction) 
def applies to?(configuration) 
state == configuration.state && character == configuration.tape.middle 
end 
end 


E 这 里 也 会 





只 有 在 机 器 的 当前 状态 和 纸 带 头 下 的 当前 字符 与 其 表达 式 匹 配 时 ， 规 则 才能 应 用 : 











注 1: 就 像 栈 一 样 ， 纸 带 是 纯 功 能 性 的 ， 写 入 纸 带 和 移动 纸 带 头 都 是 非 破坏 性 操作 ， 只 会 返 
Tape， 而 不 是 更 新 已 有 的 对 象 。 














回 一 个 新 的 





大 
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>> rule = TMRule.new(1, '0', 2, '1', :right) 
=> #<struct TMRule 

state=1， 

character="0", 

next_ state=2, 

write character="1", 

direction=:right 





> 
>> rule.applies to?(TMConfiguration.new(1, Tape.new([], '0', [], '_'))) 
=> true 
>> rule.applies to?(TMConfiguration.new(1, Tape.new([], '1', [], '_'))) 
=> false 
>> rule.applies to?(TMConfiguration.new(2, Tape.new([], '0', [], '_'))) 
=> false 
知道 一 个 规则 能 在 一 个 特定 的 配置 下 应 用 之 后 ， 我 们 需要 能 够 通过 写 入 一 个 新 字符 、 移 动 


徘 


纸 带 头 以 及 按照 规则 改变 机 器 状态 来 更 新 该 配置 : 





class TMRule 
def follow(configuration) 
TMConfiguration.new(next state, next tape(configuration)) 
end 


def next tape(configuration) 
written tape = configuration.tape.write(write character) 


case direction 
when :left 
written tape.move head left 
when :right 
written tape.move head right 
end 
end 
end 


这 些 代码 看 起 来 工作 得 很 好 : 


>> rule.follow(TMConfiguration.new(1, Tape.new([], '0', [],'_'))) 
=> #<struct TMConfiguration state=2, tape=#<Tape 1( )>> 





DTMRulebook 罗 汪 二 证 汪 DFARulebook 和 DPDARulebook 一 样 ， 只 是 方法 #next_configuration 
没有 用 字符 作为 参数 ， 这 是 因为 没有 外 部 的 输入 可 供 读 取 字 符 (只 有 纸 带 ， 而 纸 带 已 经 是 
配置 的 一 部 分 了 ) : 


class DTMRulebook < Struct.new(:rules) 
def next configuration(configuration) 
rule for(configuration).follow(configuration) 
end 


def rule for(configuration) 
rules.detect { |rule| rule.applies to?(configuration) } 
end 
end 
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我 们 现在 可 以 为 “递增 二 进 制 数 ” 的 图 灵机 创建 一 个 DTMRulepook， 并 手工 单 步 执行 一 些 
配置 : 


>> 








rulebook = DTMRulebook.new([ 
TMRule.new(1, '0', 2, '1', :right), 
TMRule.new(1, '1', 1, '0', :left), 
TMRule.new(1, ' ', 2, '1', :right), 
TMRule.new(2, '0', 2, '0', :right), 
TMRule.new(2， '1', 2, '1', :right), 
TMRule.new(2, ' ', 3, '_', :left) 

]) 

#<struct DTMRulebook rules=[...]> 


configuration = TMConfiguration.new(1, tape) 

#<struct TMConfiguration state=1, tape=#<Tape 101(1)>> 
configuration = rulebook.next_configuration(configuration) 
#<struct TMConfiguration state=1, tape=#<Tape 10(1)0>> 
configuration = rulebook.next_ configuration(configuration) 
#<struct TMConfiguration state=1, tape=#<Tape 1(0)00>> 
configuration = rulebook.next configuration(configuration) 
#<struct TMConfiguration state=2, tape=#<Tape 11(0)0>> 

















把 所 有 这 些 封装 成 一 个 DTM 类 很 方便 ， 这 样 就 像 第 2 章 里 实现 小 步 语义 时 那样 ， 我 们 可 以 
有 #step 和 #run 方法 : 


cl 


en 





ass DIM < Struct.new(:current configuration, :accept states, :rulebook) 
def accepting? 

accept states.include?(current configuration. state) 
end 


def step 
self.current configuration = rulebook.next configuration(current configuration) 
end 


def run 

step until accepting? 
end 
d 





我 们 现在 有 了 一 台 确 定型 图 灵机 的 模拟 ， 因 此 给 它 一 些 输入 试验 一 下 : 














dtm = DTM.new(TMConfiguration.new(1, tape), [3], rulebook) 
#<struct DIM ...> 

dtm.current_configuration 

#<struct TMConfiguration state=1, tape=#<Tape 101(1)>> 
dtm.accepting? 

false 

dtm. step; dtm.current configuration 

#<struct TMConfiguration state=1, tape=#<Tape 10(1)0>> 
dtm.accepting? 

false 

dtm. run 

nil 

dtm.current configuration 
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=> #<struct TMConfiguration state=3, tape=#<Tape 110(0) >> 
>> dtm.accepting? 
=> true 








就 像 对 待 DPDA 模拟 一 样 ， 为 了 能 优雅 地 处 理 卡 死 状态 的 图 灵机 我 们 需要 再 多 做 一 些 





工作 : 


>> tape = Tape.new(['1', '2', '1'], '1', [], '_') 

=> #<Tape 121(1)> 

>> dtm = DTM.new(TMConfiguration.new(1, tape), [3], rulebook) 
=> #<struct DTM ...> 

>> dtm.run 

NoMethodError: undefined method 'follow' for nil:NilClass 


这 次 我 们 不 需要 一 个 卡 死 状态 的 特殊 表示 了 。 与 PDA 不 同 ， 图 灵机 没有 外 部 输入 ， 因 此 





可 以 通过 看 它 的 规则 手册 和 当前 配置 判断 其 是 否 处 于 卡 死 状 态 : 





class DTMRuJlebook 
def applies to?(configuration) 
lrule for(configuration).nil? 
end 
end 


class DTM 
def stuck? 


laccepting? 8&& !rulebook.applies to?(current configuration) 


end 


def run 
step until accepting? || stuck? 
end 
end 


现在 模拟 会 注意 到 它 卡 住 了 并 且 自 动 停止 : 


>> dtm = DTM.new(TMConfiguration.new(1, tape), [3], rulebook) 
=> #<struct DIM ...> 

>> dtm.run 

=> nil 

>> dtm.current configuration 

=> #<struct TMConfiguration state=1, tape=#<Tape 1(2)00>> 

>> dtm.accepting? 

=> false 

>> dtm.stuck? 

=> true 





只 是 为 了 好 玩 ， 下 面 是 我 们 之 前 看 到 的 用 来 识别 'aaabbbccc' 这 样 的 字符 串 的 图 灵机 .: 











>> rulebook = DTMRulebook.new([ 
# 状态 1: 向 右 扫描 ， 查 找 a 
TMRule.new(1,'X', 1,，'X',， :right), # 跳 过 X 
TMRule.new(1，'a'，2，'X'，:right), # 删除 a， 进 入 状态 2 
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TMRule.new(1, ' ', 6, 


:left)， 


# 状态 2: 向 右 扫描 ， 查 找 b 


TMRule.new(2,'a', 2, 
TMRule.new(2,'X', 2, 
TMRule.new(2, 'b', 3, 


'a', :right), 
"X's right), 
'X', :right), 


# 状态 3: 向 右 扫 描 ， 查 找 c 


TMRule.new(3, 'b', 3, 
TMRule.new(3, 'X', 3, 
TMRule.new(3, 'c', 4, 


'b', :right), 
'X', :right), 
'X', :right), 


# 查找 空格 ， 进 入 状态 6 (接受 ) 


# 跳 过 a 
# 跳 过 X 
# 删除 b， 进 入 状态 3 


# 跳 过 b 
# 跳 过 X 
# 删除 c， 进 入 状态 4 


# 状态 4， 向 右 扫描 ， 查 找 字符 串 结束 标记 
TMRule.new(4, 'c', 4,，'c'， :right), # 跳 过 c 


TMRule.new(4, '_', 5, 


# 状态 5: 向 左 扫描 ， 查 找 字 符 


TMRule.new(5, 'a', 5, 
TMRule.new(5, 'b', 5, 
TMRule.new(5, 'c', 5, 
TMRule.new(5, 'X', 5, 
TMRule.new(5, ' ', 1, 
]) 


'_', :left), 


a', :left), 
'b', :left), 
er saleft); 
'X', :left), 
.right) 


=> #<struct DIMRulebook rules=[...]> 
>> tape = Tape.new([], 'a'’, ['a'’, 'a’, 'b', 'b', 'b'’, 'c', 'c', 'c'], '_') 


=> #<Tape (a)aabbbccc> 


# 查找 空格 ， 进 入 状态 5 


串 开 始 标记 


# 跳 过 a 
# 跳 过 b 
# 跳 过 <c 
# 跳 过 X 
# 查找 空格 ， 进 入 状态 1 


>> dtm = DTM.new(TMConfiguration.new(1，tape)，[6]，irulebook) 


=> #<struct DTM ...> 


>> 10.times { dtm.step }; dtm.current configuration 
=> #<struct TMConfiguration state=5, tape=#<Tape XaaXbbXc(c) >> 
>> 25.times { dtm.step }; dtm.current configuration 
=> #<struct TMConfiguration state=5, tape=#<Tape XXa(X)XbXXc >> 
>> dtm.run; dtm.current_configuration 
=> #<struct TMConfiguration state=6, tape=#<Tape _XXXXXXXX(X) >> 














这 个 实现 很 容易 构建 ， 只 要 我 们 有 了 表示 纸 带 和 规则 手册 的 数据 结构 ， 模 拟 一 台 图 灵机 并 
不 难 。 当 然 ， 阿 兰 ， 图 灵 特 意 让 它们 保持 简单 以 便 容易 构建 和 推导 ， 并 且 我 们 将 在 之 后 
(5.4 节 ) 看 到 实现 的 简单 性 也 是 一 个 重要 属性 。 


5.2 非 确定 型 图 灵机 




















在 3.4 广 中 ,我们 看 到 非 确定 1 


生 没有 让 有 限 








自动 机 有 什么 不 同 ， 而 4.2.2 节 表 明 一 台 非 确定 








性 的 下 推 自动 机 比 一 台 确 定性 的 能 多 做 一 些 事 情 ， 这 留 给 我 们 一 个 明显 的 关于 图 灵机 的 问 








题 : 增加 不 确定 性 ”会 使 一 台 


图 灵机 更 强大 




















3? 








答案 是 不 会 : 一 台 非 确定 型 图 灵机 并 不 能 比 一 台 确 定型 图 灵机 多 做 任何 事情 。 下 推 自动 机 
是 个 例外 ， 因 为 DFA 和 DTM 都 有 足够 的 能 力 模 拟 其 非 确 定性 的 对 应 机 器 。 有 限 自 动机 的 


注 2: 对 于 一 台 图 灵机 ,“ 不 确定 性 ”意味 着 每 个 状态 和 字符 的 组 合 会 允许 多 于 一 个 的 规则 ， 因 此 从 一 个 起 
始 配置 开始 会 有 多 个 可 能 的 执行 路 径 。 
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一 个 状态 能 用 来 表示 许多 状态 的 组 合 ， 而 图 灵机 的 一 条 纸 带 能 用 来 存储 许多 纸 带 的 内 容 ， 
但 一 个 下 推 自 动机 的 栈 无 法 同时 表示 多 个 可 能 的 栈 。 








因此 ， 就 像 有 限 自 动机 一 样 ， 一 台 确 定型 图 灵机 可 以 模拟 一 台 非 确定 型 图 灵机 。 使 用 纸 带 





























存储 由 图 灵机 配置 适当 编码 后 组 成 的 一 个 队列 ， 每 一 个 配置 都 包含 一 个 可 能 的 当前 状态 和 
所 模拟 机 器 的 纸 带 ， 模 拟 就 靠 它 运 行 。 模 拟 开始 的 时 候 ， 纸 带 上 只 存 有 一 个 配置 ， 它 表示 
所 模拟 机 器 的 初始 配置 。 模 拟 计算 的 每 一 步 执 行 都 是 先 读 取 队 列 前 面 的 配置 ， 找 到 能 用 的 
每 一 个 规则 ， 并 使 用 这 个 规则 生成 新 的 配置 ， 再 把 配置 写 回 纸 带 放 到 队 尾 。 一 旦 对 每 一 个 





规则 都 这 样 做 了 ， 最 前 面 的 配置 会 被 擦 除 ， 然 后 会 再 次 对 队列 中 的 下 一 个 配置 进行 处 理 。 




























































































这 个 机 器 模拟 的 步 又 会 一 直 重 复 ， 直 到 队列 前 面 的 配置 表示 机 器 已 经 到 达 接 受 状态 为 止 。 


这 个 技术 允许 确定 型 图 灵机 按照 广度 优先 的 顺序 探索 被 模拟 机 器 的 所 有 可 能 配置 。 如 果 对 
于 非 确定 型 图 灵机 来 说 存在 一 条 执行 路 径 到 达 一 个 接受 状态 ， 模 拟 就 会 找到 它 ， 就 算 其 他 
路 径 会 导致 无 限 循环 也 没有 关系 。 实 际 上 把 这 个 模拟 实现 为 一 个 规则 手册 要 求 大 量 的 细 
市 ， 因 此 我 们 不 会 在 这 里 进行 尝试 ， 但 能 够 用 确定 型 图 灵机 模拟 就 意味 着 我 们 不 能 仅仅 通 
过 增加 非 确定 性 就 让 一 台 图 灵机 更 强大 。 


5.3 ”最 大 能 力 












































确定 型 图 灵机 代表 了 从 有 限 计 算 机 器 到 全 能 机 器 的 临界 点 。 实 际 上 ， 通 过 升级 图 灵机 规范 





以 使 其 更 强大 的 任何 尝试 都 注定 失败 ， 因 为 它们 本 来 就 有 能 力 模拟 任何 潜在 的 增强 了 。” 


尽管 增加 某 些 特 性 会 使 图 灵机 更 小 巧 或 者 更 高 效 ， 但 无 法 从 根本 上 增强 它们 的 能 
我 们 之 前 已 经 看 到 了 对 于 非 确 定性 来 说 为 什么 这 是 对 的 。 现在 来 看 一 下 对 传统 图 灵机 的 4 个 


其 他 扩展 
可 以 增强 计算 色 
问题 。 














内 部 存储 、 子 例 程 、 多 纸 带 以 及 多 维 纸 带 一 一 并 领会 为 什么 它们 中 没有 一 个 











E 力 。 尽 管 涉及 的 模拟 技术 很 复杂 ， 但 到 最 后 ， 它 们 都 只 不 过 是 编程 方面 的 





5.3.1 内 部 存储 

为 图 灵机 设计 规则 手册 非常 让 人 泪 来 ， 因 为 它们 缺少 随机 的 内 部 存储 。 例 如 ， 我 们 经 常 想 
要 机 器 把 纸 带头 移动 到 一 个 特定 的 位 置 ， 读 取 存 在 那儿 的 字符 ， 然 后 移动 到 另 一 个 不 同 的 
部 分 ， 再 根据 之 前 读 到 的 字符 执行 某 个 动作 。 表 面 看 来 ， 这 似乎 不 太 可 能 ， 因 为 没有 地 方 








能 让 机 器 “ 记 信 


带头 移动 回 到 昼 

















”那个 字符 一 一 当然 它 仍旧 写 在 纸 带 上 ， 并 且 只 要 我 们 喜欢 ， 就 可 以 把 纸 

















里 再 次 对 其 读 取 ， 但 只 要 纸 带 头 从 那个 方 格 移 开 了 ， 我 们 就 再 也 不 能 根据 











它 的 内 容 触发 一 个 规则 了 。 














注 3: 严格 来 讲 ， 只 有 我 们 实际 知道 如 何 实现 的 增强 才 算数 。 如 果 赋 了 予 一 台 图 灵机 魔力 ， 让 它 能 立即 推理 出 














传统 图 灵机 无 法 回答 的 问题 的 答案 ， 它 确实 会 变 得 更 强大 ， 但 实际 上 ， 这 是 无 法 做 到 的 。 
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如 果 图 灵机 有 一 些 临 时 性 的 内 部 存储 〈 可 以 叫 它 “RAM ” “寄存 器 ”“ 本 地 变量 ”， 等 等 ) 
会 更 方便 ， 其 中 可 以 保存 纸 带 当前 方 格 的 字符 ， 而 且 即 使 以 后 纸 带 头 已 经 完全 移动 到 了 不 
同 的 部 分 ， 也 能 对 其 引用 。 实 际 上 ， 如 果 一 台 图 灵机 有 这 个 能 力 ， 我 们 就 疫 必 要 限制 它 存 
储 纸 带 上 的 字符 : 它 可 以 存储 任何 相关 的 信息 ， 比 如 机 器 执行 计算 的 中 间 结 末 ， 从 而 把 我 
们 从 来 回 移动 纸 带 头 向 纸 带 写 回 碎片 数据 的 繁琐 工作 中 解放 出 来 。 这 个 额外 的 灵活 性 好 像 
能 让 图 灵机 执行 新 类 型 的 任务 了 。 


就 像 非 确 定性 一 样 ， 为 图 灵机 增加 额外 的 内 部 存储 确实 会 让 某 些 任务 更 容易 执行 ， 但 它 
并 不 能 让 机 器 做 任何 它 本 来 不 能 完成 的 工作 。 把 中 间 结 果 存 在 机 器 内 部 而 不 是 纸 带 上 的 
念头 很 容易 消除 ， 因 为 即使 让 纸 带头 来 回 移动 访问 这 些 信 息 要 花费 些 工 夫 ， 用 纸 带 存储 
这 种 信息 也 能 工作 得 很 好 。 但 我 们 不 得 不 更 加 认真 地 看 待 这 个 记忆 字符 的 点 ， 因 为 如 果 
纸 带 头 移动 到 其 他 地 方 之 后 就 不 能 利用 之 前 纸 带 方 格 里 的 内 容 的 话 ， 一 台 图 灵机 的 作用 
会 非常 有 限 。 


幸好 图 灵机 有 非常 完美 的 内 部 存储 一 一 它 的 当前 状态 。 图 灵机 可 用 的 状态 数目 没有 上 限 ， 
但 对 于 任意 的 特定 规则 集合 来 说 ， 这 个 数目 一 定 是 有 限 的 并 且 要 预先 决定 好 ， 因 为 无 法 在 
计算 过 程 中 创建 新 的 状态 。 如 果 必 要 ， 我 们 可 以 设计 一 台 拥 有 100 个 、1000 个 ， 其 至 10 
亿 个 状态 的 机 器 ， 然 后 使 用 当前 状态 记 住 从 一 步 到 下 一 步 任意 数量 的 信息 。 


这 意味 着 免不了 要 复制 规则 适应 多 个 状态 ， 因 为 这 些 状 态 除 了 “ 记 住 ” 的 信息 不 同 外 都 
是 相同 的 。 一 台 机 器 不 是 只 用 一 个 状态 表示 ， 向 右 扫 描 查 找 一 个 空白 方 格 ”， 而 是 可 以 为 
“向 右 扫描 查找 一 个 空白 方 格 ( 记 住 我 之 前 读 取 到 了 一 个 3)” 设 置 一 个 状态 ， 再 为 “向 右 
扫描 查找 一 个 空白 方 格 ( 记 住 我 之 前 读 取 到 了 一 个 b)” 设 置 另 一 个 状态 ， 所 有 可 能 的 字符 
都 以 此 类 推 一 一 字符 数目 也 是 有 限 的 ， 所 以 这 样 的 复制 总 是 有 限 的 。 


下 面 是 一 个 使 用 这 种 技术 的 图 灵机 ， 它 会 把 一 个 字符 从 字符 串 的 开头 复制 到 结 




































































































































































>> rulebook = DTMRulebook.new([ 
# 状态 1: 从 磁带 读 取 第 一 个 字符 
TMRule.new(1，'a'，2，'a'，:right), # 记 住 a 
TMRule.new(1，'b',，3，'b'，:right), # 记 住 b 
TMRule.new(1，'c',，4，'c'，:right), # 记 住 < 


# 状态 2: 向 右 扫 描 ， 查 找 字符 串 结束 标记 〈 记 住 a) 
TMRule.new(2，'a'，2，'a'，:right), # 跳 过 a 
TMRule.new(2,，'b'，2，'b'，:right), # 跳 过 b 
TMRule.new(2, 'c', 2, 'C', :Tight)，# 跳 过 < 
TMRule.new(2，' '，5，'a'，:right)，# 找到 空格 ， 

# 状态 3: ei 查找 字符 串 结束 标记 ( 记 住 人 
TMRule.new(3，'a', 3，'a'，:right), # 跳 过 a 
TMRule.new(3, ‘br 3，'b'，:right), # 跳 过 b 
TMRule.new(3,，'c',， 3，'Cc'，:right), # 跳 过 c 
TMRule.new(3，''，5，'b'，:right),# 找到 空格 ， 写 b 


# 状态 4: 向 右 扫 描 ， 查 找 字 符 串 结束 标记 〈 记 住 c) 





TMRule.new(4, 'a', 4, 
TMRule.new(4, 'b', 4, 
TMRule.new(4, 'c', 4, 
TMRule.new(4, ' ', 5, 


:right), # 跳 过 a 
:right), # 跳 过 b 
:right), # 跳 过 < 
:right) # 查找 空格 ， 写 < 


门 卜 避 中 


~ vv = 


]) 
=> #<struct DIMRulebook rules=[...]> 
>> tape = Tape.new([], 'b', ['c', 'b', 'c', 'a'], '_') 
=> #<Tape (b)cbca> 
>> dtm = DTM.new(TMConfiguration.new(1, tape), [5], rulebook) 
=> #<struct DIM ...> 
>> dtm.run; dtm.current configuration.tape 
=> #<Tape bcbcab( )> 


a/aj;R 
b/b;R 
C/C;R 








除了 它们 每 一 个 所 表示 的 机 器 记 住 的 字符 串 开 头 字 符 不 同 之 外 ， 这 人 台 机 器 的 状态 2、3 和 4 


几乎 完全 相同 ， 并 且 在 这 种 情况 下 ， 在 到 达 末 端的 时 候 它 们 都 做 了 一 些 不 同 的 事情 。 


SA 


4 这 台 机 器 只 对 由 字符 a、b、c 组 成 的 字符 串 起 作用 。 如 果 想 要 其 对 由 字母 表 
4 
AN 

4 











。 里 任意 字母 组 成 的 字符 串 起 作用 (或 者 字母 数字 字符 ， 或 者 我 们 选择 的 更 大 
集合 )， 必 须 加 入 多 得 多 的 状态 (为 可 能 需要 记 住 的 每 一 个 字符 设置 一 个 状 
态 ) ， 还 得 加 入 多 得 多 的 与 之 匹配 的 规则 。 











如 果 用 这 种 方式 利用 当前 状态 ， 我 们 可 以 设计 出 任凭 纸 带头 来 回 移动 仍 能 记 住 之 前 任何 组 











合 的 图 灵机 ， 这 实际 上 与 给 一 台 机 器 提供 明确 的 “寄存 器 ”作为 内 部 存储 有 同样 的 能 


只 不 过 代价 是 使 用 了 大 量 的 状态 。 
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5.3.2 ” 子 例 程 

一 台 图 灵机 的 规则 手册 是 一 个 很 长 的 、 由 极为 低层 次 的 指令 组 成 的 硬 编码 列表 ， 因 此 在 写 
这 些 规则 时 不 忽略 机 器 应 该 执行 的 高 层次 任务 是 很 困难 的 。 如 果 存 在 调用 子 例 程 的 方法 ， 
设计 一 个 规则 手册 会 更 容易 一 些 : 如 果 机 器 的 某 个 部 分 能 把 所 有 这 些 规则 存储 成 子 例 程 ， 
比如 说 叫 “ 递 增 一 个 数 ”， 那 么 我 们 的 规则 手册 就 不 需要 手工 拼凑 这 些 指令 ， 而 只 需要 说 
“现在 递增 一 个 数 ”"， 就 能 让 一 个 数 自 增 。 或 许 这 一 次 这 种 额外 的 灵活 性 能 让 我 们 设计 出 拥 
有 新 能 力 的 机 器 。 
































但 这 实际 上 只 是 又 一 个 关于 便利 性 而 不 是 能 力 的 特性 。 就 像 有 限 自动 机 实现 正则 表达 式 片 
段 一 样 (参见 3.3.2 节 )， 儿 个 小 图 灵机 可 以 连接 在 一 起 组 成 更 大 的 图 灵机 ， 其 中 每 一 个 小 
机 器 都 实际 上 扮演 着 子 例 程 的 角色 。 我 们 之 前 看 到 的 递增 二 进 制 数 的 机 器 ， 其 状态 和 规则 
可 构建 入 一 个 把 两 个 二 进 制 数 相 加 的 大 一 些 的 机 器 ， 而 这 个 加 法 器 本 身 还 能 构建 成 可 执行 
乘法 的 更 大 的 机 器 。 


























在 小 机 器 只 需要 由 大 机 器 的 单个 状态 “调用 ”时 ， 这 很 容易 安排 : 只 需要 包含 进 小 机 器 
的 副本 ， 并 把 它 的 起 始 状 态 和 接受 状态 与 大 机 器 的 状态 在 子 例 程 调用 应 该 开始 和 结束 的 
地 方 合 并 。 这 是 我 们 使 用 递增 机 器 组 成 一 个 加 法 器 时 期 望 的 方式 ， 因 为 规则 手册 的 总 体 
设计 会 根据 需要 重复 单个 任务 一 一 “如 果 第 一 个 数 不 是 0， 就 递减 第 一 个 数 并 递增 第 二 
个 数 "。 在 机 器 中 递增 只 需要 发 生 在 一 个 地 方 ， 而 且 在 递增 的 工作 完成 之 后 只 会 有 一 个 地 
方 继续 执行 。 








在 我 们 想 要 在 整个 机 器 中 的 多 个 地 方 调用 一 个 特定 的 子 例 程 时 ， 唯 一 的 困难 才 会 出 现 。 一 
台 图 灵机 没有 办 法 存储 “返回 地 址 ”， 以 让 子 例 程 知道 一 旦 它 结束 之 后 应 该 返回 到 哪个 状 
态 ， 因 此 从 表面 上 说 ， 我 们 不 能 支持 这 种 更 通用 的 代码 重用 。 但 是 就 像 在 5.3.1 市 做 的 那 
样 ， 可 以 用 复制 解决 此 问题 : 我 们 不 是 只 构建 较 小 机 器 状态 和 规则 的 一 份 副 本 ， 而 是 会 构 
建 出 许多 份 ， 较 大 机 器 中 需要 使 用 的 每 一 个 地 方 都 对 应 一 份 。 


例如 ， 把 “递增 一 个 数 ” 的 机 器 转换 成 “给 一 个 数 加 三 ”的 机 器 ， 最 简单 的 方式 是 把 三 份 
副本 连接 到 一 起 完成 “递增 一 个 数 ， 然 后 递增 一 个 数 ， 再 递增 一 个 数 ” 的 总 体 设 计 。 这 通 
过 几 个 中 间 状 态 跟踪 通 向 最 终 目 标的 过 程 ， 甚 中 每 一 个 都 从 “递增 这 个 数 ” 发 起 ， 然 后 返 
回 一 个 不 同 的 中 间 状 态 。 






































O/05R 0/0;R 0/0;R 
1/0;L 1/1;R 1/0;L 1/1;R Wo 1/1;R 
0/1;R - ~ 





>> def increment rules(start state, return state) 
incrementing = start state 
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=> 


=> 
>> 
过 
>> 
=> 
>> 
=> 


finishing = Object.new 
finished = return state 


[ 
TMRule.new(incrementing, '0', finishing, "1 ight); 
TMRule.new(incrementing, i incrementing, '0', :left), 
TMRule.new(incrementing, '_', finishing, '1', :right), 
TMRule.new(finishing, '0', finishing, '0', :right), 
TMRule.new(finishing， '1', finishing, '1', :right), 
TMRule.new(finishing， " ', finished, " ', :left) 
] 
end 
nil 
added zero, added one, added two, added three = 0, 1, 2, 3 
[0o, 1, 2, 3] 


rulebook = DTMRulebook.new( 
increment_rules(added zero, added one) + 
increment rules(added one, added two) + 
increment rules(added two, added three) 


#<struct DTMRulebook rules=[...]> 
rulebook.rules.length 

18 

tape = Tape.new(['1', '0', '1'], '1', [], '_') 

#<Tape 101(1)> 

dtm = DTM.new(TMConfiguration.new(added zero, tape), [added three], rulebook) 
#<struct DIM ...> 

dtm.run; dtm.current configuration.tape 

#<Tape 111(0) > 


只 要 我 们 能 接受 机 器 规模 的 扩张 ， 用 这 种 方式 组 合 状态 和 规则 的 能 力 可 以 构建 任意 大 小 和 
复杂 度 的 图 灵机 ， 无 需 任何 对 子 例 程 的 明确 支持 。 








5.3.3 ”多 纸 带 


有 时 候 机 器 可 以 通过 扩展 它 的 外 部 存储 提高 能 力 。 例 如 ， 在 一 台 下 推 自动 机 可 以 访问 第 二 
个 栈 的 时 候 ， 它 会 变 得 更 强大 ， 因 为 两 个 栈 可 以 用 来 模拟 一 个 无 限 纸 带 : 每 一 个 栈 存 储 一 
半 要 模拟 的 纸 带 ， 而 这 人 台 PDA 可 以 在 两 个 栈 之 间 弹 出 和 推 入 字符 以 模拟 纸 带 头 的 动作 ， 
就 像 5.1.4 市 中 的 Tape 实现 那样 。 任 何 能 访问 无 限 纸 带 的 有 限 状态 机 实际 上 都 是 一 台 图 灵 
机 ， 因 此 很 明显 增加 一 个 额外 的 栈 会 让 一 台 下 推 自动 机 更 强大 。 






































因此 有 理由 期 待 通过 增加 一 条 或 者 多 条 纸 带 也 能 让 图 灵机 更 强大 ， 这 些 纸 带 都 有 自己 独立 














的 纸 带 头 。 但 事实 又 一 次 不 是 这 样 。 一 条 图 灵机 的 纸 带 通过 交叉 存 取 ， 会 有 足够 的 空间 存 
储 任意 纸 带 数目 的 内 容 : ee 条 纸 带 可 以 一 起 存 成 adgbehcfl。 如 果 


我 们 在 每 





位 置 了 : 











一 个 交 又 字符 的 边 上 放 上 一 个 空白 方 格 ， 机 器 Ws ea 
通过 使 用 字符 义 指 示 生 个 级 带头 的 当前 位 置 ， 我 们 可 以 用 一 条 纸 带 3_dXg_b_e_ 











hXcxf i 表示 纸 带 ab(c)、(d)ef 和 g(h)i 的 内 容 和 纸 带 头 的 位 置 。 
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使 用 多 条 模拟 的 纸 带 对 一 台 图 灵机 编程 非常 复杂 ， 但 累 人 的 读 、 写 以 及 纸 带 头 的 移动 都 可 
以 封装 成 专门 的 状态 和 规则 ( 子 例 程 ")， 这 样机 器 的 主要 逻辑 就 不 会 变 得 过 于 复杂 。 在 
任何 情况 下 ， 不 管 编程 多 么 不 方便 ， 一 台 单 纸 带 的 图 灵机 最 终 都 能 执行 多 纸 带 机 器 能 执行 
的 任何 任务 ， 因 此 为 一 台 图 灵机 增加 额外 的 纸 带 并 不 会 带 来 新 的 能 





























5.3.4 多维 纸 带 

最 后 ， 尝 试 给 一 台 图 灵机 更 广阔 的 存储 空间 是 很 有 诱惑 力 的 。 我 们 可 以 不 使 用 线性 纸 带 ， 
而 是 提供 无 限 的 二 维 网 格 ， 并 允许 纸 带 头 上 下 左右 移动 。 每 次 需要 移动 纸 带 头 快 速 访问 外 
部 存储 的 特定 部 分 时 ， 这 都 会 很 有 用 ， 而 且 不 需要 移动 纸 带 头 经 过 其 他 方 格 ， 这 还 允许 我 们 
在 多 个 字符 串 周围 留 下 无 限 的 空白 空间 ， 这 样 它们 中 每 一 个 都 很 容易 变 长 ， 而 不 是 每 次 在 我 
们 想 要 插入 一 个 字符 的 时 候 只 能 手工 整理 整个 纸 带 的 信息 以 腾 出 空间 来 。 


但 不 出 意外 的 是 ， 能 用 一 维 纸 带 模拟 一 个 网 格 。 最 简单 的 方式 就 是 使 用 两 个 一 维 纸 带 : 主 
纸 带 实际 存储 数据 ， 从 纸 带 用 来 作为 擦 写 空间 。 所 模拟 网 格 “ 的 每 一 行 都 存储 在 主 纸 带 上 ， 
顶 上 的 行 优先 ， 并 用 一 个 特殊 的 字符 标识 每 一 行 的 结尾 。 


主 纸 带 的 头像 往常 一 样 位 于 当前 字符 ， 因 此 为 了 在 模拟 网 格 上 左右 移动 ， 机 器 只 是 简单 地 
左右 移动 纸 带 头 。 如 果 纸 带头 指向 了 行 尾 的 标识 符 ， 就 会 用 一 个 子 例 程 整理 纸 带 以 便 让 网 
格 扩展 出 一 个 空间 。 


为 了 在 模拟 网 格 中 上 下 移动 ， 纸 带头 必须 向 左 或 者 向 右 分 别 移动 完整 的 一 行 。 机 器 会 先 移 
动 纸 带 头 到 当前 行 的 开头 或 者 结尾 ， 并 使 用 从 纸 带 记录 移动 的 距离 ， 然 后 把 纸 带 头 在 前 一 
行 或 者 下 一 行 移动 同样 的 偏 移 量 。 如 果 纸 带头 离开 了 所 模拟 网 格 的 最 顶部 或 者 最 底部 ， 可 
以 使 用 一 个 子 例 程 分 配 一 个 纸 带 头 能 移动 进去 的 新 空 行 。 














































































































这 个 模拟 确实 要 求 一 台 机 器 有 两 条 纸 带 ， 但 对 此 我 们 也 知道 如 何 模 拟 。 这 样 最 终 把 模拟 的 
网 格 存 储 在 两 条 模拟 的 纸 带 上 ， 而 这 两 条 纸 带 本 身 存 储 在 一 条 原始 的 纸 带 上 。 这 两 层 模 拟 
引入 了 大 量 的 额外 规则 和 状态 ， 而 且 执行 所 模拟 机 器 的 一 步 就 要 花 很 多 步 ， 但 规模 的 增加 
和 速度 的 减 慢 并 不 妨碍 它 (最 终 ) 完成 本 来 应 该 做 的 事情 。 


5.4 通用 机 器 


尽管 到 目前 为 止 我 们 看 到 的 机 器 都 有 严重 的 缺陷 ; 它们 的 规则 都 是 硬 编码 的 ， 这 让 它们 无 
法 适应 不 同 的 任务 。 一 台 能 接受 与 一 个 特定 正则 表达 式 匹 配 的 字符 串 的 DFA， 不 可 能 学 会 
接受 一 个 不 同 集合 的 字符 串 ， 一 台 能 识别 回 文 的 NPDA 将 只 能 识别 回 文 ; 一 台 递 增 二 进 制 
数 的 图 灵机 将 永远 不 能 做 其 他 用 途 。 



























































注 4: 尽管 网 格 本身 是 无 限 的， 但 只 可 能 写 入 有限 数目 的 字符 ， 因 此 我 们 只 需要 存储 包含 所 有 空白 字符 的 矩 
区 域 即 可 。 




















SN 
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大 多 数 现 实 中 的 计算 机 不 是 这 么 工作 的 。 现 代 计算 机 不 是 专门 做 某 一 项 特殊 工作 的 ， 而 是 
为 了 通用 目的 而 设计 的 并 且 能 通过 编程 执行 不 同 的 任务 。 尽 管 一 台 可 编程 计算 机 的 指令 集 
和 CPU 设计 是 固定 的 ， 但 能 通过 软件 控制 它 的 硬件 并 根据 用 户 需要 改变 它 的 行为 。 











我 们 的 简单 机 器 能 做 这 样 的 事情 吗 ? 在 做 一 件 不 同 的 工作 时 ， 不 必 每 次 去 设计 一 台新 的 机 
器 ， 而 是 设计 一 台 简 单机 器 ， 它 会 从 输入 读 取 一 个 程序 ， 然 后 做 这 个 程序 定义 的 任何 工 
作 。 这 办 得 到 吗 ? 


























或 许 不 足 为 奇 的 是 ， 一 台 图 灵机 足够 强大 ， 它 能 从 纸 带 读 取 一 台 简 单机 器 的 描述 一 一 比如 
说 ,一 台 确 定性 有 限 自动 机 一 一 然后 运行 这 台 机 器 的 模拟 以 找 出 它 的 工作 内 容 。 在 3.1.4 
节 ， 我 们 根据 描述 写 下 Ruby 代码 来 模拟 一 台 DFA， 现 在 只 需要 一 点 点 工作 就 可 以 把 那个 
代码 的 思想 转化 成 一 台 图 灵机 的 规则 手册 ， 以 运行 同样 的 模拟 。 








能 模拟 一 台 特 定 DFA 的 图 灵机 和 一 台 能 模拟 任何 DFA 的 图 灵机 有 着 重要 的 


4 
MA 4 区 别 。 











设计 一 台 图 灵机 重 现 一 台 特 定 DFA 的 行为 很 简单 一 一 毕竟 ,一 台 图 灵机 只 
不 过 是 一 台 装 有 纸 带 的 确定 性 有 限 自动 机 。DFA 规则 手册 的 每 一 条 规则 都 可 
以 直接 转 成 一 个 等 价 的 图 灵机 规则 ， 每 一 个 转换 过 来 的 规则 不 是 从 DFA 的 
外 部 输入 流 中 读 取 ， 而 是 从 纸 带 读 取 一 个 字符 ， 并 把 纸 带 头 移动 到 下 一 个 方 
格 。 但 这 不 是 特别 有 趣 ， 因 为 得 到 的 图 灵机 并 不 比 原始 的 DFA 有 用 。 


















































更 有 趣 的 是 模拟 通用 DFA 的 图 灵机 。 这 样 的 机 器 可 以 从 纸 带 读 取 一 个 DFA 
的 设计 一 一 规则 、 起 始 状 态 以 及 接受 状态 一 一 然后 遍历 那 台 DFA 执行 的 每 
一 步 ， 同 时 使 用 另 一 部 分 纸 带 跟踪 模拟 机 器 的 当前 状态 和 剩余 的 输入 。 通 用 
模拟 实现 起 来 要 难得 多 ， 但 它 让 我 们 只 要 提供 DFA 的 描述 作为 输入 ， 就 可 
以 让 图 灵机 做 一 台 DFA 能 做 的 任何 工作 。 
































I 








这 也 适用 于 对 NFA、DPDA 和 NPDA 的 Ruby 模拟， 它们 都 可 以 转换 成 能 模拟 那 种 类 型 
的 任意 自动 机 的 一 台 图 灵机 。 但 关键 是 ， 对 我 们 图 灵机 模拟 本 身 ， 它 也 能 起 作用 : 通过 把 
Tape、TMRule、DTMRulebook 以 及 DTM 重新 实现 成 图 灵机 的 规则 ， 我 们 能 设计 一 台 图 灵机 ， 
它 能 通过 从 纸 带 读 取 其 规则 、 接 受 状态 以 及 起 始 配 置 然 后 单 步 执 行 ， 模 拟 任 何其 他 确定 型 
图 灵机 ， 本 质 上 这 扮演 着 图 灵机 规则 手册 解释 器 的 角色 。 完 成 这 种 工作 的 机 器 叫 作 通用 图 
灵机 (Universal Turing Machine, UTM)。 
































这 非常 激动 人 心 ， 因 为 它 在 一 个 可 编程 装置 中 使 图 灵机 的 最 大 计算 能 力 变 得 可 用 。 我 们 可 
以 把 软件 一 一 经 过 编码 的 图 灵机 描述 一 一 写 到 纸 带 上 ， 把 这 个 纸 带 提供 给 UTM， 然 后 执 
行 软 件 产 生 想 要 的 行为 。 有 限 自动 机 和 下 推 自动 机 不 能 用 这 种 方式 模拟 它们 自身 的 类 型 ， 
因此 图 灵机 不 只 标志 着 从 能 力 有 限 的 计算 机 器 到 能 力 强大 的 计算 机 器 的 过 渡 ， 还 标志 着 从 
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单 用 途 设 备 到 全 编程 设备 的 转变 。 


简单 地 看 一 下 一 台 通 用 图 灵机 如 何 工作 。 在 实际 构建 一 台 UTM 时 ， 涉 及 大 量 的 技巧 和 无 
趣 的 技术 细 闻 ， 因 此 我 们 的 探索 将 会 相当 肤浅 ， 但 至 少 应 该 能 证 明 这 样 的 事情 是 可 能 的 。 





























5.4.1 编码 

在 设计 一 台 UTM 的 规则 手册 之 前 ， 我 们 得 决定 如 何 把 一 台 完 整 的 图 灵机 表示 成 纸 带 上 的 
一 个 字符 序列 。 一 台 UTM 需要 读 取 任意 图 灵机 的 规则 、 接 受 状态 以 及 起 始 配置 ， 然 后 随 
着 模拟 的 进程 ， 不 断 更 新 模拟 机 器 的 当前 配置 ， 因 此 我 们 需要 一 个 实用 的 方式 存储 这 些 信 
息 ， 以 便 UTM 能 与 其 协同 工作 。 


有 一 个 挑战 ， 即 每 一 台 图 灵机 都 只 能 在 它 的 纸 带 上 存储 有 限 数目 的 状态 和 有 限 数目 的 不 同 
字符 ， 这 两 个 数 都 由 它 的 规则 手册 预先 固定 好 了 ， 当 然 UTM 也 不 例外 。 如 果 我 们 设计 一 
台 UTM， 它 能 处 理 10 个 不 同 的 纸 带 字符 ， 那 它 如 何 模拟 一 台 规 则 里 使 用 11 个 字符 的 机 
器 呢 ? 如 果 我 们 更 慷慨 一 些 ， 让 它 能 处 理 100 个 不 同 的 字符 ， 那 么 当 想 要 模拟 使 用 1000 
个 字符 的 机 器 时 会 发 生 什 么 呢 ? 不 管 我 们 为 UTM 自己 的 纸 带 设计 多 少 个 字符 ， 为 了 直接 
表示 每 一 个 可 能 的 图 灵机 它 总 是 不 够 用 的 。 
























































在 所 模拟 机 器 和 UTM 之 间 还 会 有 字符 冲突 的 风险 。 为 了 在 纸 带 上 存储 图 灵机 的 规则 和 配 

置 ， 我 们 需要 能 够 用 在 UTM 中 有 特殊 含义 的 字符 标注 它们 的 边界 ， 以 便 它 能 告诉 我 们 从 

哪儿 开始 一 个 规则 结束 了 ， 另 一 个 规则 开始 了 。 但 如 果 我 们 选择 x 作为 规则 之 间 的 特定 标 

识 ， 则 只 要 所 模拟 的 任何 一 条 规则 中 含有 字符 X， 都 会 有 问题 。 即 使 我 们 设置 一 个 保留 字 

符 的 超级 特殊 集合 ， 只 给 一 台 通 用 图 灵机 使 用 ， 如 果 试 图 模拟 这 人 台 UTM 本 身 的 话 仍然 会 

引起 问题 ， 因 此 机 器 不 会 是 真正 通用 的 。 这 表明 ， 我 们 需要 茶 种 转 义 ， 以 避免 所 模拟 机 器 
9 普通 字符 被 UTM 错误 地 解释 成 特殊 字符 。 


我 们 可 以 解决 这 两 个 问题 ， 方 法 是 对 所 模拟 机 器 的 纸 带 内 容 使 用 固定 指令 系统 的 字符 进行 
编码 。 如 果 编 码 体系 只 使 用 了 特定 的 字符 ， 那 么 我 们 可 以 保证 对 UTM 来 说 把 其 他 字符 做 
特殊 目的 使 用 是 安全 的 ， 而 且 如 有 果 这 个 体系 能 容纳 任意 数目 的 模拟 状态 和 模拟 字符 ， 那 就 
没有 必要 担心 所 模拟 机 器 的 规模 和 复杂 度 了 。 






















































































只 要 能 实现 这 些 目 标 ， 这 个 编码 体系 的 具体 细节 并 不 重要 。 举 个 例子 ， 一 个 可 能 的 方法 是 
使 用 一 元 "表示 法 把 不 同 的 值 编码 成 同一 字符 重复 不 同 次 数 的 字符 串 : 如 果 所 模拟 机 器 使 
用 字符 a、b 和 <， 它们 可 以 编码 成 1、11 和 111。 另 一 个 字符 ， 如 0， 可 以 用 来 作为 值 的 
分 界 标 识 : 字符 串 abc 可 以 标识 成 101110110111。 这 种 方法 在 空间 上 效率 不 是 很 高 ， 但 它 
可 以 通过 在 纸 带 上 存储 越 来 越 长 的 由 1 组 成 的 字符 串 来 进行 扩展 ， 以 容纳 任意 数目 的 编码 
的 字符 。 


















































往 5: 二 元 基于 2， 一 元 基于 1。 
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一 旦 决定 了 如 何 对 单个 字符 进行 编码 ， 我 们 就 需要 一 种 描述 所 模拟 机 器 规则 的 方法 。 可 以 
通过 对 规则 的 各 个 部 分 (状态 、 字 符 、 下 一 状态 、 要 写 入 的 字符 、 移 动 方 向 ) 进行 编码 来 
实现 ， 然 后 把 它们 在 纸 带 上 连接 在 一 起 ， 并 在 必要 的 地 方 使 用 特殊 的 分 隔 符 。 在 示例 的 编 
码 系统 里 ， 我 们 也 可 以 用 一 元 法 表示 状态 一 一 状态 1 是 1， 状 态 2 是 11， 以 此 类 推 。 但 既 
然 知 道 只 会 有 两 个 方向 ， 那 我 们 可 以 使 用 任意 的 专用 字符 表示 左 和 右 (比如 说 L 和 R)。 














我 们 可 以 把 单个 的 规则 连 到 一 起 表示 整个 规则 手册 。 类 似 地 ， 可 以 通过 把 它 当 前 状态 的 表 
示 和 它 当 前 纸 带 内 容 的 表示 连 在 一 起 ， 来 对 所 模拟 机 器 的 当前 配置 进行 编码 。" 而 且 这 给 
了 我 们 想 要 的 : 一 台 完 整 的 图 灵机 以 字符 串 的 形式 写 在 另 一 台 图 灵机 的 纸 带 上 ， 准 备 通过 
模拟 开始 自己 的 生命 周期 。 


5.4.2 ”模拟 

从 根本 上 说 ,通用 图 灵机 和 我 们 在 5.1.4 市 构建 的 Ruby 模拟 的 工作 方式 一 样 ， 只 是 要 费力 
得 多 。 

所 模拟 机 器 的 描述 一 一 它 的 规则 手册 、 接 受 状 态 以 及 起 始 配置 一 一 都 以 编码 的 格式 存在 于 
UTM 的 纸 带 上 。 为 了 执行 模拟 的 一 步 ，UTM 要 在 规则 、 当 前 状态 和 所 模拟 机 器 的 纸 带 之 间 
来 回 移动 纸 带 头 ， 以 搜索 出 能 应 用 到 当前 配置 的 一 条 规则 。 它 找到 一 条 规则 的 时 候 ， 就 会 根 
据 规则 里 定义 的 字符 和 方向 ， 更 新 所 模拟 的 纸 带 ， 并 把 所 模拟 的 机 器 放 到 新 的 状态 上 去 。 



















































































这 个 过 程 会 一 直 重 复 ， 直 到 所 模拟 的 机 器 进入 到 一 个 接受 状态 ， 或 者 到 达 某 个 配置 后 因为 
没有 规则 应 用 处 于 卡 死 的 状态 。 








注 6: 我 们 没有 详细 说 明 纸 带 应 该 如 何 表示 ， 但 这 也 不 难 ， 而 且 总 是 可 以 选用 5.3.3 节 的 多 纸 带 技术 把 它 存 
储 到 所 模拟 的 从 纸 带 上 。 
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第 二 部 分 


计算 与 可 计算 性 





在 本 书 的 第 一 部 分 ， 我们 已 经 讨论 了 儿 个 熟悉 的 计算 示例 : 命令 式 编程 语言 、 状 态 机 ， 以 
及 通用 计算 机 。 那 些 示 例 向 我 们 展示 了 计算 差不多 就 是 使 用 一 个 系统 操纵 信息 并 回答 问题 
的 过 程 。 


在 第 二 部 分 ， 我 们 将 会 大 胆 些 ， 先 在 不 熟悉 的 地 方 寻求 计算 ， 最 后 探索 关于 计算 机 器 所 能 
做 之 事 的 根本 限制 。 


作为 程序 员 ， 我 们 与 编程 语言 和 机 器 打交道 ， 它 们 是 根据 我 们 对 世界 的 认 知 模型 进行 设计 
的 ， 而 且 我 们 期 望 它们 带 有 一 些 特 性 ， 能 轻松 地 把 我 们 的 思想 转换 成 实现 。 这 些 以 人 为 中 
心 的 设计 是 由 便利 性 而 非 必要 性 驱动 的 ， 甚 至 一 台 设 计 简 单 的 图 灵机 ， 也 会 让 我 们 想起 用 
纸 和 铅笔 工作 的 数学 家 。 


但 是 计算 并 不 只 会 发 生 在 友好 的 、 为 我 们 所 熟悉 的 机 器 上 。 更 多 不 寻常 的 系统 的 计算 能 
同样 强大 ， 即 使 它们 内 部 的 工作 机 制 对 于 人 类 来 说 不 容易 控制 或 理解 。 我 们 将 探索 这 个 思 
想 ， 在 第 6 章 尝 试用 极 小 的 语言 (这 种 语言 似乎 根本 没什么 有 用 的 特性 ) 写 程序 ， 并 在 第 
7 章 审视 各 种 简单 的 系统 ， 看 看 它们 如 何 像 更 复杂 的 机 器 一 样 执 行 同样 的 计算 。 


在 确信 许多 种 系统 里 都 可 能 发 生 强大 的 计算 后 ， 第 8 章 将 探讨 计算 本 身 的 能 力 。 人 们 很 
自然 地 认为 ， 只 要 付出 足够 的 时 间 和 努力 写 一 个 合适 的 程序 ， 就 能 让 计算 机 解决 几乎 任 
何 问题 ， 但 事实 证 明了 存在 一 个 理论 约束 : 有 些 问题 无 法 用 任何 计算 机 解决 ， 不 管 它 多 
快 多 高 效 。 
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遗憾 的 是 ， 一 些 不 能 解决 的 问题 涉及 程序 行为 的 预测 ， 而 这 恰好 是 程序 员 想 要 计算 机 帮 他 
们 做 的 。 我 们 将 会 看 到 一 些 应 对 计算 世界 中 这 些 硬 限制 的 策略 ， 而 第 9 草 将 探索 如 何 利用 
抽象 找 出 无 法 回答 的 问题 的 近似 答案 。 
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第 6 章 


从 零 开始 编程 





如 果 你 想 从 头 开始 制作 苹果 派 ， 必 须 先 创造 整个 宇宙 。 
一 一 卡尔 . 萨 根 
本 书 中 ， 我 们 一 直 在 试图 构建 计算 模型 来 理解 计算 。 到 目前 为 止 ， 我 们 设计 了 想象 中 带 有 


不 同 约 束 的 简单 机 器 ， 并 看 到 不 同 的 约束 会 产生 出 拥有 不 同 计算 能 力 的 系统 ， 以 此 对 计算 
进行 了 建 模 。 








第 5 章 的 图 灵机 很 有 意思 ， 因 为 它们 不 依赖 复杂 的 特性 就 能 实现 复杂 的 行为 。 只 要 有 一 条 
纸 带 、 一 个 读 写 头 以 及 一 个 固定 的 规则 集合 ， 图 灵机 就 足以 模拟 拥有 更 好 存储 能 力 、 支 持 
非 确定 性 执行 或 者 任何 其 他 奇妙 特性 的 机 器 行为 。 这 告诉 我 们 ， 成 熟 的 计算 不 需要 机 器 具 
备 大 量 的 潜在 复杂 性 ， 只 需要 其 具备 存储 、 检 索 以 及 使 用 数据 进行 简单 决策 的 能 


计算 模型 不 一 定 非 要 看 起 来 像 机 器 ， 它 们 可 以 看 起 来 像 编程 语言 。 第 2 章 的 Simple 编程 
语言 当然 可 以 执行 计算 ， 但 它 的 执行 过 程 没 有 图 灵机 那么 优雅 。 它 已 经 有 了 大 量 语法 ( 数 
字 、 布 尔 值 、 二 进 制 表达 式 、 变 量 、 赋 值 、 序 列 、 条 件 、 循 环 ) ， 而 且 我 们 甚至 还 没有 开 
始 为 其 增加 特性 ， 以 使 其 适合 写真 正 的 程序 : 字符 串 、 数 据 结构 、 过 程 调 用 ， 等 等 。 






































把 Simple 转换 成 真正 有 用 的 编程 语言 将 会 是 一 项 艰苦 的 工作 ， 最 终 的 设计 会 包含 大 量 的 细 
节 ， 不 会 对 揭示 计算 的 本 质 帮助 太 多 。 从 零 开始 创建 某 个 最 小 的 东西 一 编程 语言 世界 的 
一 台 图 灵机 ， 这 样 我 们 就 可 以 看 到 对 于 计算 来 说 ， 哪 些 特性 是 本 质 的 ， 哪 些 特性 是 偶然 的 


噪音 。 








本 章 ， 我 们 将 研究 一 种 叫 作 无 类 型 lambda 演算 (untyped lambda calculus) 的 极 小 编程 语 
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JI 


。 首 先 ， 我 们 将 用 尽 可 能 少 的 语言 特性 写 〈 用 Ruby) 一 些 接近 lambda 演算 的 程序 。 这 
将 仍然 仅仅 是 在 用 Ruby 编程 ， 但 施加 虚构 的 约束 之 后 ， 我 们 便 能 很 轻松 地 探索 一 个 受 限 
的 语义 ， 而 不 需要 学 习 一 门 新 语言 。 然 后 ， 我 们 了 解 到 这 些 非常 有 限 的 特性 集合 能 做 什么 
以 后 ， 就 将 利用 这 些 特性 把 它们 实现 为 一 种 语言 〈 使 用 它 自己 的 解析 器 、 抽 象 语法 和 操作 
语义 ) 一 一 使 用 我 们 在 之 前 章节 中 学 到 的 技术 。 


6.1 模拟 lambda 演 算 


为 了 理解 如 何 使 用 最 小 语言 编程 ， 我 们 不 打算 使 用 Ruby 诸多 有 用 的 特性 来 解决 问题 。 很 
自然 ， 这 意味 着 没有 gem， 没 有 标准 库 ， 没 有 模块 module)、 方 法 、 类 或 者 对 象 ， 既 然 
我 们 试图 尽 可 能 地 做 到 最 小 ， 那 还 将 避免 使 用 控制 结构 、 赋 值 、 数 组 、 字 符 串 、 数 字 和 布 
尔 值 。 


当然 ， 如 果 我 们 避免 使 用 Ruby 的 所 有 特性 ， 那 就 没有 语言 可 用 来 编程 了 ， 因 此 下 卫 
要 保留 的 : 












































是 将 

















。 对 变量 进行 引用 ， 
。 创建 proc; 
。 调用 proc。 





这 意味 着 只 能 写 出 如 下 样子 的 Ruby 代码 : 
->x{->y {x.call(y) }} 


圭 妆 





这 大 致 就 是 无 类 型 lambda 演算 程序 的 样子 ， 足 以 接近 我 们 的 目的 了 。6.2 节 
人 Q 4 、 会 详细 讨论 ambda 演算 。 

0 
为 了 让 代码 更 简短 并 且 更 容易 阅读 ， 我 们 还 将 使 用 常量 作为 缩写 : 如 果 创建 了 一 个 复杂 的 
表达 式 ， 可 以 把 它 赋 值 给 一 个 常量 ， 给 它 一 个 短 名 字 以 便 以 后 再 次 使 用 。 引 用 这 个 名 字 与 
重新 输入 原始 表达 式 没有 区 别 (名 字 只 是 让 代码 更 加 简洁 ) ， 因 此 我 们 会 依赖 于 Ruby 的 赋 
值 特性 。 任 意 时 刻 都 可 以 通过 替换 每 一 个 常量 所 引用 的 proc 来 取消 缩写 ， 这 样 做 的 代价 是 
会 让 程序 变 得 更 长 。 








6.1.1 使 用 proc 工 作 
既然 要 用 proc 构建 整个 程序 ， 让 我 们 在 深度 使 用 它们 之 前 花 一 分 钟 看 看 它们 的 属性 。 


目前 ， 我 们 将 使 用 完整 特性 的 Ruby 来 描绘 proc 的 一 般 行为 。 在 我 们 开始 写 
。 代码 来 解决 6.12 节 的 “问题 ”时 ， 才 会 施加 这 些 限 制 。 




















1. 管道 


proc 是 值 在 程序 中 进行 移动 的 管道 。 考 虑 调用 下 面 的 proc 时 会 发 生 什么 : 














->x{x+2}.call(1) 











作为 参数 提供 给 调用 的 值 1， 传 入 代码 块 x 的 参数 中 ， 然 后 把 参数 传 给 用 到 它 的 所 有 地 方 ， 
因此 Ruby 最 后 会 对 1+2 求 值 。 语 言 的 其 他 部 分 会 做 实际 的 工作 ，proc 只 是 把 一 部 分 程序 
连接 在 一 起 并 让 值 流 向 需要 它 的 地 方 。 

对 使 用 最 小 化 Ruby 的 实验 来 说 这 已 经 有 了 不 好 的 兆头 。 如 果 proc 只 能 在 实际 使 用 值 的 
Ruby 片段 之 间 移 动 值 ， 那 怎么 才能 只 用 proc 就 能 构建 有 用 的 程序 呢 ? 探索 完 proc 的 其 他 
属性 之 后 ， 我 们 就 会 理解 。 

2. 参数 

proc 可 以 带 有 多 个 参数 ， 但 这 不 是 一 个 本 质 特性 。 如 果 得 到 一 个 能 处 理 多 个 参数 的 













































































->x,y{ 
x+y 
}.call(3, 4) 


i 我 们 总 是 可 以 将 其 重 写 为 捞 入 式 的 单 参数 proc: 


->x{ 
-> yl 
X + y 
} 
}.call(3).call(4) 








这 里 ， 外 部 proc 的 参数 是 x， 而 且 会 返回 内 部 的 proc， 内 部 的 proc 也 带 有 一 个 参数 y。 我 
们 可 以 使 用 x 的 一 个 值 调 用 外 部 的 proc， 然 后 使 用 y 的 一 个 值 调 用 内 部 的 proc， 而 且 我 们 
会 得 到 与 多 参数 时 同样 的 结果 。? 


既然 我 们 在 尽 可 能 多 地 去 掉 Ruby 的 特性 ， 那 就 限制 自己 只 创建 和 调用 单 参数 的 proc 吧 。 


这 不 会 让 事情 变 得 更 糟糕 。 


3. 等 价 

查 明 一 个 proc 内 部 代码 的 唯一 途径 就 是 调用 它 ， 因 此 如 果 使 用 同样 的 参数 调用 两 个 proc， 
会 产生 相同 结果 的 话 ， 那 么 即使 它们 的 内 部 代码 不 同 ， 它 们 也 是 可 交换 的 。 这 种 根据 外 部 
可 见 行为 判断 两 者 相等 的 思想 叫 作 外 延 等 价 (extensional equality ) 。 




















比如 说 我 们 有 一 个 叫 p 的 proc: 








和 curry 化 ， 并 且 我 们 可 以 使 用 Proc#curry 自动 进行 这 个 转换 。 


并 
二 


注 13 
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>>p=->n{n*2} 
=> #<Proc (lambda)> 

















我 们 可 以 再 创建 一 个 叫 q 的 proc， 它 带 有 一 个 参数 并 且 只 是 用 这 个 参数 调用 p: 





>>q= -> x {p.call(x) } 
=> #<Proc (lambda)> 


q 明显 是 两 个 不 同 的 proc， 但 它们 外 延 相 等 ， 因 为 它们 对 任何 参数 来 讲 都 会 做 同样 的 





>> p.call(5) 
=> 10 
>> q.call(5) 
=».10 


知道 p 与 -> x { p.call(x) } 等 价 ,这 就 为 重 构 提 供 了 新 的 机 会 。 如 果 在 我 们 的 程序 里 看 到 


-> Xx { p.call(x) } 这 种 一 般 模式 ， 我 们 可 以 选择 用 p 替换 整个 表达 式 来 消除 它 ， 而 在 某 
些 情况 下 (后面 会 看 到 )， 我 们 可 能 会 决定 采用 相反 的 方式 。 


4. 语法 
对 于 创建 和 调用 proc，Ruby 提供 了 一 个 语法 选择 。 从 现在 开始 ， 我 们 会 使 用 -> arguments 
{ body } 创建 一 个 proc， 然 后 使 用 方 括号 调用 它 : 





>> ->x{x+5 }[6] 
=> 11 


这 样 无 需 额外 的 语法 就 很 容易 看 到 proc 的 主体 和 参数 。 





6.1.2 ”问题 
我 们 的 目标 是 写 出 著名 的 FizzBuzz 程序 : 





写 一 个 程序 输出 数字 1 到 100。 但 如 果 数 字 是 3 的 倍数 ， 就 不 输出 数字 而 是 输出 
“Fizz”, 如 果 是 5 的 倍数 就 输出 “Buzz”。 对 于 那些 3 和 5 的 公 倍 数 ,就 输出 "FizzBuzz 。 
一 一 Imran Ghory,“ 用 FizzBuzz 找到 热爱 编码 的 开发 者 ” 

(Using FizzBuzz to Find Developers who Grok Coding, http://imranontech. 
com/2007/01/24/using-fizzbuzz-to-find-developers-who-grok-coding/) 


这 是 故意 挑选 的 一 个 简单 问题 ， 用 来 测试 一 个 面试 者 是 否 有 编程 经 验 。 任 何 知道 如 何 编程 
的 人 应 该 都 能 毫 无 困难 地 解决 这 个 问题 。 








下 面 是 使 用 完整 特性 Ruby 的 一 个 实现 : 


(1..100).each do |n| 





if (n % 15).zero? 
puts 'FizzBuzz" 
elsif (n % 3).zero? 


puts “Fizz”， 

elsif (n % 5).zero? 
puts “Buzz”， 

else 
puts n.to_s 

end 


end 


这 不 是 FizzBuzz 最 聪明 的 一 个 实现 (还 存在 着 大 量 更 聪明 的 实现 ，http://redd.it/10d7w)， 
但 它 很 直接 ， 任 何人 都 可 以 不 用 思考 就 写 出 来 。 


但 是 ， 这 个 程序 含有 一 些 puts 语句 ， 而 我 们 没 法 只 使 用 proc 就 把 文本 输出 到 控制 台 ，? 因 
此 我 们 把 它 奉 换 成 一 个 大 致 等 价 的 程序 ， 这 个 程序 只 返 





(1..100).map do |n| 
if (n % 15).zero? 


"FizzBuzz" 


elsif (n % 3).zero? 


下 Zz 


elsif (n % 5).zero? 


"Buzz" 
else 
n.to s 
end 
end 














回 一 个 字符 串 数组 而 不 是 输出 它们 : 


对 FizzBuzz 问题 来 说 这 仍然 是 一 个 有 意义 的 解决 方案 ， 但 现在 的 这 个 版 本 我 们 有 可 能 只 用 


proc 就 实现 了 。 














不 管 它 多 简单 ， 如 果 没 有 一 种 编程 语言 的 任何 特性 的 话 ， 这 仍然 是 要 求 非常 高 的 程序 : 它 























创建 一 个 范围 ， 对 其 做 映射 ， 对 一 个 大 的 条 件 求 值 ， 使 用 取 模 操作 进行 算数 运算 ， 使 用 
Fixnum#zero? 预测 ， 使 用 一 些 字符 串 ， 而 且 还 用 Fixnum#to_s 把 数字 转换 成 字符 串 。 这 用 
到 了 很 多 Ruby 内 建功 能 ， 而 我 们 将 要 把 它们 全 部 去 除 再 用 proc 重新 实现 。 














6.1.3 数字 


我 们 准备 从 关注 FizzBuzz 中 








上 现 的 数字 姑 





其 他 数据 类 型 ， 就 表示 出 数字 呢 ? 
如 果 打 算 从 头 开 始 实现 数字 “， 我 们 最 好 对 要 实现 的 东西 有 个 透彻 的 理解 。 到 底 什 么 是 数 




















字 呢 ? 如 果 不 对 试 








注 2: 




















注 3: 具体 说 来 ， 我 们 这 有 





F 始 。 





但 那 会 让 我 们 的 练习 复杂 化 , 而 且 变 得 没意思 。FizzBuzz 不 是 关 了 
想 要 实现 的 是 非 负 整数 : 0、1、2、3 等 。 











怎么 才能 不 用 Fixnum 或 者 Ruby 提供 的 任何 











图 定义 的 东西 的 某 个 方面 进行 假设 ， 就 很 难 








给 出 一 个 具体 的 定义 。 例 





我 们 当然 可 以 对 向 控制 台 输出 进行 建 模 , 引入 一 个 proc 来 表示 标准 输 








, 然后 设计 如 何 向 它 发 送 文 本 ， 


ls a 





F 输 


的 , 而 是 关于 算数 和 控制 流 的 。 


Li 
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如 ,“ 革 个 东西 告诉 我 们 有 多 少 ……” 没 有 用 ， 因 为 “多 少 ” 只 是 “数字 ”的 另 一 种 表述 
方式 。 


下 面 是 描绘 数字 特征 的 一 种 方式 ， 想象 我 们 有 一 袋子 苹果 和 一 袋子 橘子 。 我 们 从 一 个 袋子 
里 取出 一 个 华 果 ， 从 另 一 个 袋子 里 取出 一 个 橘子 ， 然 后 把 它们 放 到 一 起 。 之 后 我 们 不 断 地 
取出 一 个 苹果 和 一 个 橘子 ， 直 到 至 少 其 中 有 一 个 袋子 变 成 空 的 。 


如 果 两 个 袋子 同时 变 成 空 的 ， 我 们 就 学 到 了 一 件 有 趣 的 事情 : 尽管 个 有 不 同 的 东西 ， 但 这 
两 个 袋子 有 一 个 共有 的 属性 ， 这 个 属性 意味 着 它们 同时 变 空 了 ， 在 不 断 从 每 个 袋子 里 取出 
水 果 的 每 一 个 时 刻 ， 两 个 袋子 都 不 是 空 的 或 者 两 个 袋子 都 是 空 的 。 袋 子 共 有 的 这 个 抽象 性 
质 就 是 我 们 可 以 叫 作 数字 的 东西 (尽管 不 知道 是 哪个 数字 ! ) ， 而 且 我 们 可 以 把 这 两 个 袋 
子 与 世界 上 的 任何 其 他 袋子 做 比较 ， 来 看 看 跟 它们 是 不 是 有 着 同样 的 “ 数 ”。 


因此 描绘 数字 特征 的 一 种 方式 是 某 个 动作 的 重复 (或 者 叫 选 代 ) ， 在 这 个 例子 中 动作 是 从 
袋子 里 取 一 个 物体 。 每 一 个 数字 都 与 重复 一 个 动作 的 唯一 方式 对 应 : 数字 1 对 应 的 是 只 执 
行 这 个 动作 ;数字 2 对 应 的 是 执行 这 个 动作 然后 再 次 执行 ， 以 此 类 推 。 并 不 奇怪 ， 数 字 0 
对 应 着 根本 不 执行 这 个 动作 。 


既然 创建 和 调用 proc 是 这 里 程序 唯一 可 以 执行 的 “动作 ”， 我 们 可 以 尝试 用 代码 实现 一 个 
数字 n， 在 代码 里 对 调用 proc 这 个 动作 重复 n 次 。 

























































































例如 ， 如 果 人 允许 定义 方法 一 一 这 是 不 允许 的 ， 不 过 我 们 只 是 玩 一 玩 一 一 那么 我 们 可 以 把 
#one 定义 成 一 个 方法 ， 它 带 有 一 个 proc 参数 以 及 另 一 个 任意 的 参数 ， 而 且 它 会 用 该 任意 
参数 调用 proc: 





def one(proc, x) 
proc[x] 
end 























我 们 还 可 以 定义 外 wo， 它 会 调用 一 次 proc， 然 后 用 第 一 次 调用 的 结果 对 其 再 次 调用 :“ 





def two(proc, x) 
proc[proc[x]] 
end 


以 此 类 推 : 
def three(proc, x) 


proc[proc[proc[x]]] 
end 


按照 这 种 模式 ， 可 以 很 自然 地 把 #zero 定义 为 一 个 带 有 proc 和 男 一 个 参数 的 方法 ， 这 个 方 
法 完全 忽略 proc ( 换 句 话说， 对 其 调用 零 次 )， 并 且 会 原封 不 动 地 返回 第 二 个 参数 : 


注 4: 这 叫 作 “ 和 迭代 这 个 国 数 "。 
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def zero(proc, x) 
x 
end 


所 有 这 些 实现 都 可 以 转换 成 无 方法 的 表示 。 例 如 ， 我 们 可 以 用 带 有 两 个 参数 ”的 proc 替换 
方法 #one， 然 后 用 第 二 个 调用 参数 调用 第 一 个 参数 。 它 们 看 起 来 是 这 样 : 














ZERO = ->pt{ { x }} 
ONE = ->p{->xt p[x] }} 
TO =->p{->x{ ppx]l }} 
THREE = -> p { -> x { p[p[p[x]]] } 


把 数据 表示 为 纯 代 码 的 技术 称 为 印 坷 编码 (Church encoding)， 它 是 以 

4 4 、lambda 演算 《http://dx.doi.org/10.2307/2371045) 的 发 明 者 阿 隆 佐 ' 印 奇 的 名 

字 命 名 的 。 这 些 数字 是 钱 奇 数 (Church numeral) ， 而 且 我 们 很 快 将 会 看 到 外 
奇 布尔 值 (Church Boolean) 和 印 奇 有 序 对 (Church pair) 的 例子 。 























尽管 在 FizzBuzz 解决 方案 里 我 们 回避 了 Ruby 的 特性 ， 但 是 一 旦 超出 了 我 们 的 代码 范围 
把 数字 的 这 些 外 部 表示 转换 成 Ruby 值 会 很 用， 这样 它 们 就 能 在 控制 台 进 行 检查 和 在 测 
试 中 断言 ， 或 者 至 少 能 让 我 们 相信 它们 确实 本 来 代表 数字 。 











幸运 的 是 ， 可 以 写 一 个 枇 o_integer 方法 执行 这 个 转换 : 


def to integer(proc) 
proc[->n{n+1}][o] 
end 


这 个 方法 带 有 表示 一 个 数字 的 proc 并 用 另 一 个 proc 和 原始 的 Ruby 数字 0 来 调用 它 (这 个 
proc 只 是 递增 它 的 参数 )。 如 果 我 们 使 用 ZERO 调用 其 o_integer， 那 么 因为 ZERO 的 定义 ， 
递增 的 proc 不 会 得 到 调用 ， 这 样 我 们 会 原封 不 动 得 到 0: 








>> to_integer(ZERO) 
=% 站 


果 用 THREE 调用 楷 o_integer， 递 增 的 proc 将 会 被 调用 三 次 ， 这 样 我 们 得 到 Ruby 的 3: 




















而 女 








ee 








>> to_integer(THREE) 

二 3 
因此 基于 proc 的 表示 只 是 在 对 数字 进行 编码 ， 并 且 我 们 可 以 根据 需要 把 它们 转 成 更 实用 的 
表示 。 














注 5: 实际 上 ,“ 带 有 两 个 参数 ”并 不 准确 ,因为 我 们 已 经 限制 自己 只 使 用 单 参数 的 proc 了 (参见 6.1.1 节 中 “ 参 
数 ” 部 分 )。 准 确 的 说 法 是 “ 带 有 一 个 参数 并 且 返 回 一 个 带 有 另 一 个 参数 的 新 的 proc” ,但 那 太 绕 嘴 了 ， 
所 以 我 们 采用 这 种 简略 的 说 法 ， 只 是 要 记 住 真正 的 意思 是 




































































二 
N 








o 





从 零 开始 编程 | 155 


对 于 FizzBuzz， 需 要 数字 5、15 和 100， 它 们 都 可 以 用 同样 的 技术 实现 : 














这 些 都 不 是 很 简洁 的 定义 ， 但 它们 确实 可 以 工作 ， 就 像 用 其 o_integer 确认 的 那样 : 





>> to_integer(FIVE) 
a 

>> to_integer(FIFTEEN) 
=> 15 

>> to_integer(HUNDRED) 
=> 100 


因此 ， 回 到 FizzBuzz 程序 ， 所 有 的 Ruby 数字 都 可 以 用 基于 proc 的 实现 替换 : 





(ONE. .HUNDRED) .map do |n| 
if (n % FIFTEEN).zero? 
'FizzBuzz" 
elsif (n % THREE).zero? 
'Fizz" 
elsif (n % FIVE).zero? 
'Buzz" 
else 
n.to s 
end 
end 


地 aa， 


我 们 写成 ONE 而 不 是 -> p { -> x { pLx] } 等 ， 这 是 为 了 让 代码 更 清晰 。 








遗憾 的 是 ， 这 个 程序 不 再 工作 了 ， 因 为 我 们 在 对 基于 proc 的 数字 实现 上 使 用 了 像 .. 和 % 这 
样 的 运算 符 。 因 为 不 知道 如 何 处 理 ， 所 以 Ruby 将 会 这 样 报 错 : TypeError: can't iterate 
from Proc, NoMethodError: undefined method `%' for #<Proc (lambda)>。 为 了 使 用 这 些 表 


示 ， 我 们 需要 替换 掉 所 有 运算 ， 并 且 只 能 使 用 proc 完成 。 


但 是 在 我 们 能 重新 实现 任何 一 个 操作 之 前 ， 需 要 实现 true 和 false。 


6.1.4 布尔 值 
我 们 怎样 才能 只 用 proc 表示 布尔 值 呢 ? 布尔 值 只 会 存在 于 条 件 语句 当中 ， 而 且 通 常情 况 
下 ， 一 个 条 件 会 说 “if 某 个 布尔 值 then 这 样 else 那样 ” : 


























>> success = true 

=> true 

>> if success then 'happy' else 'sad' end 
=> "happy" 

>> success = false 

=> false 

>> if success then 'happy' else 'sad' end 
=> "sad" 














所 以 一 个 布尔 值 的 真正 工作 是 允许 在 两 个 选项 中 做 选择 ， 因 此 我 们 可 以 利用 这 一 点 ， 把 
布尔 值 表示 成 在 两 个 值 中 选择 其 一 的 proc。 我 们 不 是 把 一 个 布尔 值 看 成 一 段 无 生命 的 
代码 ， 它 被 将 来 的 代码 读 取 并 能 决定 选择 两 个 选项 中 的 哪 一 个 ， 而 只 是 直接 把 它 实 现 
为 一 段 代码 ， 这 段 代 码 在 用 两 个 选项 进行 调用 的 时 候 ， 要 么 选择 第 一 个 选项 要 么 选择 第 


sp 


CEE 家 








实现 成 方法 的 村 Tue 和 #false 可 能 是 : 


def true(x, y) 
x 
end 


def false(x, y) 


y 
end 


#true 是 一 个 带 有 两 个 参数 并 返回 第 一 个 参数 的 方法 ， 而 #false 带 有 两 个 参数 并 返回 第 二 
个 。 这 足够 提供 给 我 们 粗 线条 的 条 件 行为 了 : 














>> success = :true 

=> :true 

>> send(success, 'happy', 'sad') 
=> "happy" 

>> success = :false 

=> :false 

>> send(success, 'happy', 'sad') 
=> "sad" 


像 以 前 一 样 直接 把 这 些 方 法 转换 成 proc: 


TRUE 
FALSE 





->x{->y{x}} 
人 


就 像 之 前 定义 了 其 o_integer 方法 作为 检查 ， 以 便 能 够 把 基于 proc 的 数字 转换 成 Ruby 数 
字 一 样 ， 我 们 可 以 定义 枇 o_boolean 方法 ， 以 便 能 把 TRUE 和 FALSE 的 proc 转换 成 Ruby 原 
始 的 true 和 false 对 象 ， 





def to boolean(proc) 
proc[truel][false] 
end 
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这 个 函数 带 有 一 个 表示 布尔 值 的 参数 ， 然 后 使 用 true 作为 第 一 个 参数 而 false 作为 第 二 个 
参数 调用 它 。TRUE 只 是 会 返回 它 的 第 一 个 参数 ， 因 此 to_boolean (TRUE) 将 会 返回 true， 
而 FALSE 会 返回 false: 








>> to_boolean(TRUE ) 
=> true 
>> to_boolean(FALSE) 
=> false 


因此 用 proc 表示 布尔 值 出 奇 地 简单 ， 但 对 于 FizzBuzz， 我 们 不 只 需要 布尔 值 ， 还 需要 用 
proc 实现 Ruby 的 if-elseif-else。 事 实 上 ， 由 于 这 些 布尔 值 实现 的 工作 方式 ， 很 容易 写 
出 村 f 方法: 




















def if(proc, x, y) 


proc[x][y] 
end 


而 这 很 容易 转换 成 一 个 proc: 


F's 二 
->b 


很 明显 IF 不 需要 做 什么 有 用 的 工作 ， 因 为 布尔 值 自己 就 会 找到 合适 的 参数 一 一 IF 只 是 添 
加 的 糖 一 一 但 看 起 来 比 直接 调用 布尔 值 更 自然 : 


>> IF[TRUE]['happy'][ sad'] 
=> "happy" 

>> IF[FALSE]['happy' ]['sad'] 
a oad 








这 还 意味 着 我 们 可 以 修改 其 o_boolean 方法 以 使 用 IF: 


def to boolean(proc) 
IF[proc][true][false] 
end 


尽管 我 们 在 重 构 ， 但 值得 一 提 的 是 ， 像 6.1.1 节 中 “相等 ”部 分 讨论 的 那样 ，IF 的 实现 含 


有 与 更 简单 的 proc 等 价 的 proc， 所 以 IF 的 实现 能 被 显著 简化 。 例 如 看 一 下 IF 的 最 内 层 
实现 : 

















这 段 代码 的 意思 是 : 


(1) 带 上 一 个 参数 y; 
(2) 用 参数 x 调用 b 得 到 一 个 proc; 
(3) 用 参数 y 调用 这 个 proc。 





第 (1) 步 和 第 (3) 步 没什么 用 ， 在 我 们 使 用 一 个 参数 调用 这 个 proc 的 时 候 ， 它 只 是 把 这 个 
参数 传 给 另 一 个 proc。 因 此 整个 proc 只 是 与 第 (2) 步 等 价 ， 也 就 是 b[x] ， 而 我 们 可 以 把 无 
用 的 代码 从 TF 的 实现 中 移 除 ， 以 便 让 它 更 简洁 ; 











在 最 内 层 我 们 又 看 到 了 同样 的 模式 : 
{ 
] 








->X 
b[x 
} 


基于 同样 的 原因 ， 这 个 proc 与 b 相同 ， 因 此 我 们 可 以 进一步 简化 IF: 





IF=->b{b} 


我 们 不 能 再 进一步 简化 了 。 








IF 没 做 什么 有 用 的 事情 (是 TRUE 和 FALSE 在 做 全 部 的 工作 )， 因 此 我 们 可 以 

人 AS 4， 去 掉 它 以 做 进一步 的 简化 。 但 我 们 的 目标 是 把 原始 的 FizzBuzz 程序 尽 可 能 忠 

尾 ， 实 地 转换 成 proc， 因 此 尽管 IF 仅仅 起 到 装饰 作用 ， 但 使 用 IF 提醒 我 们 if- 
elsif-else 表达 式 在 原始 程序 中 出 现 的 位 置 会 很 方便 。 








不 管 怎样 ， 现 在 有 了 IF， 可 以 回 到 FizzBuzz 程序 把 Ruby 的 if-elsif-else 杰 换 成 对 IF 的 
嵌 套 调用 了 : 


(ONE. .HUNDRED) .map do |n| 
IF[(n % FIFTEEN).zero?][ 
'FizzBuzz" 
][IF[(n % THREE).zero?][ 
"E12 
][IF[(n % FIVE).zero?][ 
'Buzz" 
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6.1.5 ”谓词 


我 们 下 一 步 的 工作 是 用 基于 proc 的 实现 替换 Fixnum#zero?， 这 个 实现 将 会 与 基于 proc 的 
数字 一 起 工作 。 处 理 Ruby 值 的 #zero? 的 基本 算法 像 下 面 这 样 : 




















def zero?(n) 
if n == 0 
true 
else 
false 
end 
end 


(这 有 些 元 余 ， 但 它 明确 了 所 发 生 的 事情 : 把 这 个 数字 与 0 比较 ， 如果 相等 就 返回 true， 
否则 返回 false。) 








我 们 如 何 才能 让 它 处 理 proc 而 不 是 Ruby 数字 呢 ? 请 再 看 一 下 数字 的 实现 ， 


ZERO = ->p{f->xt X 上 村 
ONE = ->pft->xt p[x] }} 
TWO =->p{->x{ plp[lx]] }} 

= ->p{->x{plplpLlx]]l] }} 


THREE 














注意 ，ZERO 是 唯一 不 调用 p 的 数字 一 一 它 只 是 返回 x 一 一 但 所 有 其 他 的 数字 至 少 会 调用 p 
一 次 。 我 们 可 以 利用 这 一 点 : 如 果 用 TRUE 作为 第 二 个 参数 调用 一 个 未 知 的 数字 ， 则 如 果 数 
字 是 ZER0， 它 将 立即 返回 TRUE。 如 果 不 是 ZER0， 它 会 返回 调用 p 返回 的 东西 ， 因 此 如 果 我 
们 让 p 成 为 一 个 总 是 返回 FALSE 的 proc， 就 会 得 到 想 要 的 行为 ， 














def zero?(proc) 
proc[-> x { FALSE }][TRUE] 
end 


把 它 重 写 成 一 个 proc 还 是 很 容易 : 





IS ZERO = -> n { n[-> x { FALSE }][TRUE] } 








我 们 可 以 使 用 共 o_boolean 在 控制 台 上 检查 它 的 工作 情况 : 








>> to_boolean(IS ZERO[ZERO]) 
=> true 
>> to_boolean(IS ZERO[THREE]) 
=> false 


这 工作 得 很 好 ， 所 以 在 FizzBuzz 里 ， 我 们 可 以 把 所 有 对 #zero? 的 调用 替换 成 IS_ZERO: 


(ONE. .HUNDRED) .map do |n| 
IF[IS ZERO[n % FIFTEEN]][ 





"FizzBuzz" 

][IF[IS ZERO[n % THREE]][ 
"Fizz" 

J[IF[IS ZERO[n % FIVE]][ 
"Buzz 


end 


6.1.6 ”有 序 对 
我 们 已 经 有 了 数字 和 布尔 值 形式 的 可 用 数据 ， 但 还 没有 能 有 条 理 地 存储 超过 一 个 值 的 任何 
数据 结构 。 为 了 实现 更 复杂 的 功能 ， 我 们 将 很 快 需要 某 种 数据 结构 ， 因 此 先 来 介绍 一 个 。 


最 简单 的 数据 结构 是 有 序 对 (pair)， 它 跟 二 元 数组 类 似 。 有 序 对 实现 起 来 非常 容易 : 





PAIR = ->x{->y{->f{ fx[y] }}} 
LEFT = ->p{pl->x{->y{x}}]} 
RIGHT = ->p {pl->x{->y{y}}]} 














一 个 有 序 对 的 作用 是 存储 两 个 值 ， 并 在 之 后 根据 需要 再 次 提供 。 为 了 构建 一 个 有 序 对 ， 我 
们 用 两 个 值 (一 个 x 和 一 个 y) 调用 PAIR， 然 后 返回 它 的 内 部 proc: 








-> f { flxj[y] } 
这 个 proc 在 用 另 一 个 为 f 的 proc 调用 时 ,会 用 较 早 的 x 和 yy 的 值 作为 参数 回调 它 。LEFT 
和 RIGHT 会 从 一 个 有 序 对 中 分 别 选 出 左边 和 右边 的 元 素 ， 它 们 会 调用 一 个 proc， 这 个 proc 
分 别 返 回 其 第 一 个 和 第 二 个 参数 。 它 足够 简单 : 








>> my_pair = PATR[THREE] [FIVE] 
=> #<Proc (lambda)> 

>> to integer(LEFT[my_pair]) 
=> 3 

>> to integer(RIGHT[my_pair]) 
=> 5 





这 个 非常 简单 的 数据 结构 足够 我 们 使 用 了 ，6.1.8 节 中 将 使 用 有 序 对 ， 将 其 作为 更 复杂 结构 
的 一 个 基础 结构 。 


6.1.7 ”数值 运算 


现在 有 了 数字 、 布 尔 值 、 条 件 、 谓 词 以 及 有 序 对 ， 我 们 几乎 准备 好 重新 实现 模 运 算 符 了 。 


在 对 两 个 数 进行 模 运算 之 前 ， 我 们 需要 能 够 执行 更 简单 的 运算 ， 如 递增 和 递减 一 个 数 。 递 
增 相当 直接 : 
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INCREMENT = -> n { ->p{->x {pinfp][x]] } }} 





看 一 下 INCREMENT 如 何 工作 : 我 们 用 基于 proc 的 数字 mn 调用 它 ， 它 会 返回 一 个 新 的 proc， 
这 个 proc 像 数字 那样 带 有 某 个 其 他 proc p 和 某 个 任意 的 第 二 参数 x。 














我 们 调用 这 个 新 的 proc 的 时 候 它 会 做 什么 呢 ? 首先 它 会 以 pp 和 x 作为 参数 调用 "一 一 因为 
n 是 一 个 数字 ， 所 以 这 意味 着 就 像 原 始 的 数字 那样 ,“ 在 x 上 对 p 进行 n 次 调用 ”一 一 然后 
对 结果 再 调用 一 次 p。 那 么 总 体 说 来 ， 这 个 proc 的 第 一 个 参数 会 在 它 的 第 二 个 参数 上 调用 
n+1 次 ， 这 恰好 是 表示 数字 n+1 的 方法 。 











但 递减 呢 ?” 这 看 起 来 是 个 更 难 的 问题 ,一旦 一 个 proc 已 经 调用 了 n 次 ， 再 额外 增加 一 次 调 
用 以 便 成 为 nt1 次 调用 是 相当 容易 的 ， 但 没有 明显 的 方法 可 以 撤销 一 次 调用 以 便 成 为 n-1 
次 调用 。 











一 个 解决 办 法 就 是 设计 一 个 proc， 在 对 某 个 初始 参数 调用 n 次 的 时 候 返 回 数字 n-1。 吉 运 
的 是 ， 有 序 对 正好 可 以 帮助 我 们 实现 这 种 方法 。 思 考 一 下 这 个 Ruby 方法 所 做 的 : 





def slide(pair) 
[pair.last, pair.last + 1] 
end 


在 我 们 用 数字 组 成 的 二 元 数组 为 参数 调用 slide 时 ， 它 会 返回 一 个 新 的 二 元 数组 ， 这 个 二 
元 数组 包含 第 二 个 数字 还 有 比 第 二 个 数字 大 1 的 数字 ， 如 果 输 入 的 数组 包含 的 是 连续 数 
字 ， 那 么 效果 就 是 向 上 “滑动 ”一 个 数字 窗口 : 








>> slide([3, 4]) 
=> [4, 5] 
>> slide([8, 9]) 
=> [9，10] 





这 很 有 用 ， 因 为 通过 在 -1 处 开始 一 个 窗口 ， 我 们 可 以 安排 一 种 情况 ， 让 数组 里 的 第 一 个 
数字 比 我 们 调用 slide 的 次 数 小 1， 即 使 我 们 只 是 在 递增 数据 : 


>> slide([-1, 0]) 

=> [0，1] 

>> slide(slide([-1, 0])) 

=> [1, 2] 

>> slide(slide(slide([-1, 0]))) 

= [2, 3] 

>> slide(slide(slide(slide([-1, 0])))) 
= [35 4] 














我 们 不 能 只 用 基于 proc 的 数字 完成 ， 因 为 没 法 表示 -1， 但 side 的 有 趣 之 处 是 不 管 怎样 
它 只 关注 数组 中 的 第 二 个 数 ， 因 此 我 们 可 以 放 入 任意 的 哑 值 (dummy value) 比如 说 
0 一 一 替换 掉 -1， 这 样 仍然 能 得 到 同样 的 结果 : 

















>> slide([0, 0]) 


=> [0, 1] 


>> slide(slide([0, 0])) 


ES 


>> slide(slide(slide([0, 0]))) 


= [2， 3] 


>> slide(slide(slide(slide([0, 0])))) 


= 六 [5 4] 





这 是 让 DECREMENT 工作 的 关键 : 我 们 可 以 把 slide 转 成 一 个 proc， 使 用 数字 n 的 proc 表示 对 
由 ZERO 组 成 的 有 序 对 调用 slide n 次 ， 然 后 使 用 LEFT 从 结果 的 有 序 对 中 拉 出 左边 的 数 来 : 


SLIDE 


DECREMENT = -> n { LEFT[n[SLIDE][PAIR[ZERO][ZERO]] 


= -> p { PAIR[RIGHT[p]][INCREMENT[RIGHT[p]]] } 
] 


] 
} 


下 面 是 DECREMENT 的 作用 : 


>> to _ integer(DECREMENT[FIVE]) 


=> 4 


>> to integer(DECREMENT[FIFTEEN]) 


=> 14 


>> to_integer(DECREMENT[HUNDRED]) 


= 99 


>> to _ integer(DECREMENT[ZERO]) 


=> 0 
丧 aa 
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DECREMENT[ZERO] 的 结果 实际 上 只 是 最 初 的 PAIR[ZEROj[ZERO] 值 的 左边 元 素 ， 


。 在 这 种 情况 下 根本 就 没有 对 其 调用 过 SLIDE。 既 然 没 有 负 值 ，0 就 是 我 们 能 提 














供给 DECREMENT[ZERO] 的 最 合理 的 答案 ， 因 此 使 用 0 作为 哑 值 是 个 好 主意 。 














既然 我 们 有 了 INCREMENT 和 DECREMENT， 就 可 能 实现 类 似 加 法 、 减 法 、 乘 法 和 取 需 这 样 的 数 


字 运 算 了 : 


ADD 
SUBTRACT 
MULTIPLY 
POWER 





= ->m{ -> n { n[INCREMENT][m] } } 
= ->m{ -> n { n[DECREMENT][m] } } 
=->m{ ->n { n[ADD[m]][ZERO] } } 
= ->m{ -> n { n[MULTIPLY[m]][ONE] } } 


这 些 实现 在 很 大 程度 上 是 自 解释 的 。 如 果 我 们 想 要 m 加 mn， 只 需要 “从 开始 对 其 递增 n 
次 ”， 同 样 这 也 适用 于 减法 ， 有 了 ADD 之 后 ， 我 们 可 以 进行 m 乘 n， 方 法 是 “从 ZERO 开始 ， 
对 其 进行 n 次 ADD m”"， 使 用 MULTIPLY 和 ONE 进行 备 运 算 也 类 似 。 














过 4 


4 
ei 


Um 





在 6.2.2 节 “ 规 约 表达 式 ” 部 分 中 ， 我 们 将 用 Ruby 完成 ADD[ONE][ONE] 的 小 
步 求 值 ， 以 便 展 示 它 如 何 产 生 TW0。 





这 些 算数 足够 我 们 起 步 了 ， 但 在 能 用 proc 实现 % 之 前 ， 我 们 需要 了 解 一 个 执行 模 运 算 的 
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算法 。 下 面 是 其 对 Ruby 数字 的 处 理 : 


def mod(m，n) 
if n<= mm 
mod(m - n，n) 
else 
m 
end 
end 





例如 ， 为 了 计算 17 模 5 可 以 进行 如 下 操作 : 






































。 如 果 5 小 于 等 于 17， 这 是 事实 ， 那 么 就 用 17 减 去 5， 然后 在 结果 上 调用 mod 方法 ， 也 
就 是 说 12 模 5; 

。 5 小 于 等 于 12， 因 此 尝试 7 模 5; 

。 5 小 于 等 于 7， 因 此 尝试 2 模 5; 

。 5 不 再 小 于 等 于 2， 因此 返回 结果 2。 









































但 我 们 还 不 能 用 proc 实现 #mod， 因 为 它 使 用 了 另 一 个 运算 符 <=， 我 们 还 没有 实现 它 ， 因 
此 需要 暂时 先 用 proc 实现 <=。 


可 以 从 看 起 来 不 相干 的 对 Ruby 数 的 提 ess_or_equal? 实现 开始 : 





def less or equal?(m, n) 
m- nx<=0 
end 








这 没什么 用 ， 因 为 它 依赖 于 <=， 但 至 少 它 把 问题 分 解 成 了 两 个 我 们 已 经 解决 的 其 他 问题 
了 : 减法 和 与 零 作 比较 。 减 法 我 们 已 经 处 理 过 了 ， 与 零 的 相等 性 我 们 也 完成 了 ， 但 我 们 如 
何 实现 小 于 等 于 零 的 判断 呢 ? 




















磅 巧 我 们 不 需要 担心 ， 因 为 零 已 经 是 我 们 知道 如 何 实现 的 最 小 的 数 了 。 回 忆 一 下 ， 我 们 基 
于 proc 的 数字 都 是 非 负 的 ， 因 此 “小 于 零 ” 在 我 们 的 数字 系统 里 是 无 意义 的 概念 


如 果 从 一 个 小 一 点 的 数 里 用 SUBSTRACT 减 去 一 个 大 一 点 的 数 ， 将 只 会 返回 ZER0， 因 为 没 法 
返回 一 个 负数 ， 并 且 ZERO 是 能 得 到 的 最 接近 的 值 了 “: 

















>> to_integer(SUBTRACT[FIVE][THREE]) 
=> 2 
>> to_integer(SUBTRACT[THREE][FIVE]) 
=>0 


我 们 已 经 写 了 IS_ZER0， 并 且 因 为 如 果 m 小 于 等 于 n (也 就 是 说 n 至 少 与 m 一 样 大 ) 的 话 
SUBTRACT[m] [nj] 会 返回 ZERO0， 所 以 足 可 以 用 proc 实现 #1less_or _ equal? 了 : 

















注 6: 你 可 能 会 抗议 3-5=0 不 叫 “ 减 法 ”， 你 是 对 的 : 这 种 运算 的 专业 名 称 叫 “monus”， 因 为 加 法 之 下 的 非 
负 整数 形成 的 是 可 交换 么 半 群 而 不 是 一 个 合适 的 阿 贝尔 群 。 














def less or equal?(m, n) 
IS ZERO[SUBTRACT[m][n]] 
end 


让 我 们 把 这 个 方法 转 成 proc: 
IS_LESS OR EQUAL = 
->m{->nf 
IS ZERO[SUBTRACT[m][n]] 
}} 


它 能 正常 工作 吗 ? 


>> to boolean(IS LESS OR EQUAL[ONE][TWO]) 


=> true 


>> to_boolean(IS_LESS OR EQUAL[TWo][TWo]) 


=> true 


>> to boolean(IS LESS OR EQUAL[THREE][TWO]) 


=> false 


看 起 来 不 错 。 


这 补 上 了 #mod 实现 中 缺少 的 部 分 ， 因 此 可 以 用 proc 重 写 它 : 





def mod(m，mn) 
IF[IS LESS OR_EOUAL[n][m]][ 
mod(SUBTRACT[m][n], n) 
][ 


m 


] 


end 
并 用 一 个 proc 替换 掉 方 法 定义 : 
MOD = 
->m{->nft 
IF[IS LESS OR_EOUAL[n][m]][ 


n 
MOD[SUBTRACT[m][n]][n] 
][ 


m 
}} 
太 好 了 ! 它 能 工作 吗 ? 


>> to_integer(MOD[THREE][TWO]) 


SystemStackError: stack level too deep 


Ruby 在 调用 MOD 的 时 候 进入 了 无 限 递 归 





循环 ， 





因为 我 们 把 Ruby 的 原始 功能 转换 成 proc 时 
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漏 掉 了 条 件 语 义 中 一 些 重 要 的 东西 。 在 像 Rupy 这 样 的 语言 里 ， 计 -else 语句 是 非 严 格 的 
(或 者 说 是 懒 的 ) : 我 们 给 它 一 个 条 件 和 两 个 代码 块 ， 然 后 它 会 对 条 件 求 值 以 决定 对 哪个 代 
码 块 求 值 并 返回 一 一 它 从 来 也 不 会 对 两 个 代码 块 都 求 值 。 


IF 实现 的 问题 是 我 们 无 法 利用 构建 到 else 里 的 懒 性 行为 。 我 们 只 能 说 “调用 
一 个 proc，IF， 其 参数 是 两 个 其 他 的 proc”， 因 此 Ruby 冲 出 来 ,在 IF 有 机 会 决定 返回 哪 
个 之 前 就 对 两 个 参数 都 进行 求 值 。 


再 看 一 下 MOD: 


MOD = 

->m{->nf 

IF[IS LESS OR EQUAL[nN][m]][ 
MOD[ SUBTRACT[m] [n]][n] 
































m 


] 

3 

在 我 们 对 m 和 n 调 用 MOD， 而 Ruby 开始 对 内 部 proc 的 代码 体 求 值 时 ， 它 会 对 
MOD[SUBTRACT[m][nj][n] 进行 递归 调用 并 立即 开始 把 它 当 作 传 递 给 IF 的 参数 求 值 ， 不 管 
IS_ LESS OR_EOUAL[n][m] 是 TRUE 还 是 FALSE。 对 MOD 第 二 次 调用 的 结果 是 又 一 次 无 条 件 的 
递归 调用 ， 以 此 类 推 ， 从 而 会 无 限 递 归 下 去 。 


为 了 修正 ， 我 们 需要 一 种 方式 告诉 Ruby 延迟 对 IF 第 二 个 参数 的 求 值 ， 直 到 确定 需要 对 其 
求 值 为 止 。Ruby ee 个 proc 里 延迟 ， 但 在 一 个 proc 
内 封装 一 个 任意 的 Ruby 值 通常 会 改变 其 含义 〈 如 1+2 的 结果 并 不 等 于 ->{1+2})， 因 此 我 
们 可 能 需要 做 得 更 聪明 一 些 。 


幸运 的 是 没 必 要 这 样 做 ， 因 为 这 是 一 个 特殊 情况 : 我 们 知道 因为 所 有 的 值 都 是 单 参数 的 
proc， 所 以 调用 MOD 的 结果 也 将 会 是 一 个 单 参数 的 proc， 并 且 我 们 已 经 知道 (参见 6.1.1 节 
中 “相等 ”部 分 )， 对 于 任意 的 proc p， 另 一 个 proc 将 其 封装 ， 它 与 p 参数 相同 并 立即 用 
此 参数 调用 p， 它 们 将 会 产生 同样 的 值 ， 因 此 我 们 可 以 使 用 这 个 技巧 延迟 递归 调用 而 不 影 
响 传递 给 IF 的 值 的 含义 ， 






























































MOD = 
->m{->nf 
IF[IS LESS OR EQUAL[nN][m]][ 
->x{ 
MOD[SUBTRACT[m][n]][n][x] 








这 把 递归 的 MOD 调用 封装 到 -> x { .….[x] } 以 对 其 延迟 。Ruby 现在 不 会 在 调用 IF 的 时 候 
试图 对 这 个 proc 的 代码 体 求 值 了 ， 但 如 果 这 个 proc 被 正 选 中 并 作为 结果 返回 ， 它 就 能 被 
接受 者 调用 ， 最 终 触 发 〈 现 在 肯定 是 需要 的 ) 对 MOD 的 递归 调用 。 









































MOD 现在 能 工作 吗 ? 


>> to_integer(MOD[THREE][TWO]) 

=> 1 

>> to_integer(MOD[ 
POWER[THREE] [THREE] 


[ 
ADD[ THREE] [Two] 
]) 


=> 2 
是 的 ， 太 好 啦 ! 
但 是 先 别 庆祝 ， 因 为 还 有 一 个 更 环 手 的 问题 : 我 们 在 用 常量 MOD 定义 常量 M0D， 因 此 这 个 定 
义 不 只 是 一 个 缩写 。 这 次 我 们 不 仅仅 在 把 一 个 复杂 的 proc 赋值 给 一 个 常量 以 便 之 后 重用 。 事 
实 上 ， 我 们 在 依赖 Ruby 的 赋值 语义 ， 尽 管 仍 然 在 定义 MOD， 但 它 很 明显 还 没有 被 定义 ， 然 而 
我 们 可 以 在 MOD 的 实现 中 引用 它 ， 并 期 望 在 之 后 对 其 求 值 的 时 候 它 已 经 被 定义 了 。 
那 是 在 欺骗 ， 因 为 原则 上 我 们 应 该 能 撤销 掉 所 有 的 缩写 一 “我们 提 到 MO0D 的 地 方 ， 实 际 
的 意思 是 这 个 长 长 的 proc” 但 只 要 MOD 由 其 自身 定义 这 就 不 可 能 。 





















































我 们 可 以 使 用 Y 组 合子 解决 此 问题 ， 这 些 著 名 的 辅助 代码 恰恰 是 为 此 目的 : 无 欺骗 地 定义 
一 个 递归 函数 。 下 面 是 它 的 样子 : 




















Y= -> f{-> x{ fxLx]] }[-> x { flx[x]] }] } 


三 言 两 语 很 难 解释 Y 组 合子 ,但 下 面 是 一 个 梗概 (技术 上 不 准确 ) : 当 我 们 使 用 一 个 proc 
调用 YY 组 合子 的 上 时候， 它 会 用 proc 本 身 作 为 第 一 个 参数 对 proc 进行 调用 。 因 此 ， 如 果 我 
们 写 了 一 个 需要 一 个 参数 的 proc 并 用 那个 proc 调用 这 个 Y 组 合子 ， 那 么 这 个 proc 将 会 把 
自身 作为 参数 ， 从 而 只 要 它 想 要 调用 自身 的 时 候 就 可 以 使 用 那个 参数 。 


悲剧 的 是 ， 由 于 和 MOD 永远 循环 一 样 的 原因 ，Y 组 合子 在 Ruby 中 也 会 永远 循环 下 去 ， 
此 我 们 需要 一 个 修订 后 的 版 本 。 是 表达 式 x[x] 引起 了 这 个 问题 ， 而 我 们 可 以 再 次 修正 这 
个 问题 ， 方 法 是 每 次 这 个 表达 式 出 现 ， 就 把 它 封装 到 -> y { …:[y] 上 内 部 以 延迟 它们 的 
求 值 : 
































2Z2=->ft->xtftfl>yftxxryiy>xtfl>ytxxy }] }] } 
Z 组 合子 ， 它 是 立 组 合子 对 于 像 Ruby 这 样 严 格 语言 的 变换 。 


这 





日 
最 后 我 们 可 以 创建 MOD 的 一 个 满意 实现 了 ， 方 法 是 给 MOD 提供 一 个 额外 的 参数 f， 封 装 对 
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MOD = 
Z[->f{->m{->nf 
IF[IS LESS OR EQUAL[nN][m]][ 
->x{ 
f[SUBTRACT[m][n]]j[n][x] 
} 
][ 


m 
] 
} 上 
谢 天 谢 地 ，M0D 的 这 个 无 欺骗 的 版 本 仍然 能 工作 : 


>> to_integer(MOD[THREE][TWO]) 
= 
>> to_integer(MOD[ 

POWER[ THREE] [THREE] 


工 
ADD[THREE][TWO] 
) 


] 
=> 2 


围绕 它 的 乙 组 合子 的 调用 ， 这 样 在 我 们 之 前 调用 MOD 的 地 方 都 可 以 调用 f: 


现在 我 们 可 以 把 FizzBuzz 程序 中 % 出 现 的 地 方 都 替换 成 MOD 的 调用 : 


(ONE. .HUNDRED) .map do |n| 

F[IS ZERO[MOD[n][FIFTEEN]]][ 
'FizzBuzz" 

IF[IS ZERO[MOD[n][THREE]]][ 
FEZ 

IF[IS ZERO[MOD[N][FIVE]]][ 
‘Buzz" 








6.1.8 列表 





对 于 FizzBuzz 我 们 只 遗留 了 几 个 Ruby 特性 要 重新 实现 : 范 











围 (range)、#map、 字 符 串 字 




















硬 量 以 及 Fixnum#to_s。 对 于 已 经 实现 的 值 和 运算 我 们 已 经 看 到 了 大 量 细 市 ， 





因此 我 们 将 会 





快速 浏览 其 余 的 特性 并 尽 可 能 地 减少 细节 。( 不 要 担心 需要 理解 所 有 的 东西 ,我 们 只 是 浅 党 


辑 止 。) 





为 了 能 够 实现 范围 和 加 ap， 我 们 需要 实现 列表 (list)， 而 构建 列表 的 最 简单 方法 就 是 使 用 
有 序 对 (pair)。 这 个 实现 像 链 表 一 样 工作 ， 其 中 每 个 有 序 对 都 保存 一 个 值 和 一 个 指向 链表 
中 下 一 个 有 序 对 的 指针 。 在 这 里 ， 我 们 不 使 用 指针 而 是 使 用 怠 入 式 的 有 序 对 。 标 准 的 列表 














运算 看 起 来 是 这 样 : 
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EMPTY 
UNSHIFT 


PAIR[TRUE] [TRUE] 
->1{->xt{ 
PAIR[FALSE][PAIR[x][1]] 
} 

LEFT 

-> 1 { LEFT[RIGHT[1]] } 
-> 1 { RIGHT[RIGHT[1]] } 


IS_EMPTY 
FIRST 
REST 


它们 像 这 样 工 作 : 





>> my_list = 
UNSHIFT[ 
UNSHIFT[ 
UNSHIFT[EMPTY] [THREE] 
][Two] 
] [ONE] 
=> #<Proc (lambda)> 
>> to _integer(FIRST[my_list]) 
=> 1 
>> to _ integer(FIRST[REST[my_list]]) 
ES 
>> to integer(FIRST[REST[REST[my list]]]) 
=> 3 
>> to boolean(IS EMPTY[my_list]) 
=> false 
>> to boolean(IS EMPTY[EMPTY]) 
=> true 








使 用 FIRST 和 REST 取出 列表 中 的 单个 元 素 相 当 策 抽 ， 因 此 就 像 处 理 数 字 和 布尔 值 那样 ， 我 
们 可 以 写 一 个 楷 o_array 方法 以 便 在 控制 台 上 提供 帮助 : 














def to array(proc) 
array = [] 


until to boolean(IS EMPTY[proc]) 
array.push(FIRST[proc]) 
proc = REST[proc] 

end 


array 
end 


这 让 监视 列表 更 为 容易 : 


>> to array(my_list) 

=> [#<Proc (lambda)>, #<Proc (lambda)>, #<Proc (lambda)>] 
>> to array(my list).map { |p| to integer(p) } 

=> 上， 2， 3] 











如 何 实现 范围 呢 ? 事实 上 ， 与 其 找到 一 种 方式 显 式 地 把 范围 表示 成 proc， 不 如 只 写 一 个 
proc， 它 可 以 构建 范围 内 的 所 有 元 素 的 列表 。 对 于 原始 的 Ruby 数字 和 “列表 ”( 如 数组 )， 
我 们 可 以 这 么 写 : 
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def range(m, n) 
if mx=n 
range(m + 1, Nn).unshift(m) 
else 
[] 
end 
end 








在 预期 可 用 的 列表 操作 方面 ， 这 个 算法 稍 嫌 做 作 ， 但 能 讲 得 通 : 由 m 到 n 所 有 数字 组 成 的 
列表 与 由 mt1 到 n 组 成 的 列表 〈 并 在 前 头 放 上 m) 一 样 ， 如果 m 比 n 大 ， 那 这 个 由 数字 组 成 
的 列表 就 是 空 的 。 


幸运 的 是 ， 我 们 已 经 有 了 把 这 个 方法 直接 转换 成 proc 所 需要 的 一 切 : 











RANGE = 
Zz[-> f{ 
->m{->nf 
IF[IS LESS OR EQUAL[m][n]][ 
->x{ 
UNSHIFT[f[INCREMENT[m]][n]][m][x] 


Ya 
注意 Z 组 合子 对 递归 的 使 用 ， 以 及 条 件 语 句 的 TRUE 分 支 周 围 的 -> x { .…. 
4 
(00%. 
4 




















ll 





它 能 正常 工作 吗 ? 


>> my_range = RANGE[ONE][FIVE] 

=> #<Proc (lambda)> 

>> to array(my range).map { |p| to integer(p) } 
三 放 [sy 2，3，4， 5] 


是 的 ， 可 以 正常 工作 ， 所 以 让 我 们 在 FizzBuzz 中 使 用 : 


RANGE[ONE][HUNDRED] .map do |n 
F[IS_ZERO[MOD[n][FIFTEEN]]][ 
"FizZzBuzz” 
[IF[IS ZERO[MOD[n][THREE]]][ 
"Flzz 
[IF[IS ZERO[MOD[n][FIVE]]][ 
'Buzz" 











为 了 实现 各 ap， 我 们 可 以 使 用 一 个 叫 FOLD 的 辅助 方法 ， 它 有 点 像 Ruby 中 的 Enumerabje#inject: 





FOLD 令 写 出 能 处 理 列 表 中 每 一 项 元 素 的 proc 变 得 更 简单 : 


>> to_integer(FOLD[RANGE[ONE][FIVE]][ZERO][ADD]) 

=> 15 

>> to_integer(FOLD[RANGE[ONE][FIVE]][ONE][MULTIPLY]) 
=> 120 





一 旦 有 了 FOLD， 我 们 就 可 以 简洁 地 写 出 MAP 来: 


{ 
[EMPTY][ 
{ -> x { UNSHIFT[1][f[x]] } } 


MAP 能 正常 工作 吗 ? 


>> my list = MAP[RANGE[ONE][FIVE]][INCREMENT] 
=> #<Proc (lambda)> 

>> to array(my list).map { |p| to integer(p) } 
三 之 [2， 3，4，5， 6] 


是 的 ， 可 以 正常 工作 。 因 此 我 们 可 以 替换 掉 FizzB 中 的 map 了 : 


MAP[RANGE[ONE][HUNDRED]][-> n 
IF[IS ZERO[MOD[n][FIFTEEN]]] 
"FizzBuzz" 
[IF[IS ZERO[MOD[n][THREE]]][ 
“EZ2 
[IF[IS ZERO[MOD[n][FIVE]]][ 
‘Buzz" 
[ 
n.to s 


]] 


{ 
[ 














}] 
差不多 完成 了 ! 就 剩 下 处 理 字符 串 了 。 
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6.1.9 字符 串 





字符 串 很 容易 处 理 : 我 们 可 以 只 是 把 它们 表示 成 由 数字 组 成 的 列表 ， 只 要 对 哪个 数字 表示 


哪个 字符 的 编码 达成 一 致 就 可 以 。 





我 们 可 以 选择 任何 编码 ， 因 此 不 使 用 像 ASCII 这 样 的 通用 目的 的 编码 ， 而 是 设计 一 种 对 于 
FizzBuzz 更 方便 的 新 型 编码 。 只 需要 对 数字 和 字符 串 'FizzBuzz'、'Fizz' 以 及 'Buzz' 进 








行 编码 就 可 以 ， 因 此 可 以 使 用 0 到 9 表示 字符 '0' 到 '9'， 而 把 字符 'B'、 





和 'z' 编码 成 10 ~ 14。 





a 和 We 


这 样 我 们 就 有 了 一 种 方式 来 表示 需要 的 字符 串 字面 量 (注意 不 要 截断 乙 组 合子 ) : 





TEN = MULTIPLY[TNO][FIVE] 
B = TEN 
= INCREMENT[B 
I = INCREMENT[F 
U = INCREMENT[I 
ZED = INCREMENT[U 


FIZZ = UNSHIFT[UNSHIFT[UNSHIFT[UNSHIFT[EMPTY][ZED]][ZzED]][I]] 
BUZZ = UNSHIFT[UNSHIFT[UNSHIFT[UNSHIFT[EMPTY][ZzED]][ZzED]][u]] 
FIZZBUZZ = UNSHIFT[UNSHIFT[UNSHIFT[UNSHIFT[BUZZ][ZED]][ZED]][I] 























为 了 检查 其 是 否 能 正常 工作 ， 可 以 写 一 些 外 部 的 方法 ， 把 它们 转换 成 Ruby 字符 串 : 


def to char(c) 
"0123456789BFiuz' .slice(to integer(c)) 
end 


def to string(s) 
to array(s).map { |c| to char(c) }.join 
end 


好 了 ， 字 符 串 能 工作 了 吗 ? 


>> to_char(ZED) 
>> to_string(FIZZBUZZ) 
=> "FizzBuzz" 


大 好 啦 。 那 么 可 以 在 FizzBuzz 中 使 用 它们 了 : 


MAP[RANGE[ONE] [HUNDRED]][-> n 
IF[IS_ZERO[MOD[n][FIFTEEN]]] 
FIZZBUZZ 
][IF[IS_zERO[MOD[n][THREE]]][ 
FIZZ 

][IF[IS ZERO[MOD[n][FIVE]]][ 
BUZZ 


{ 
[ 








最 后 要 实现 的 是 Fixnum#to_s。 为 此 ， 我 们 需要 能 把 数 分 割 成 组 成 它 的 数字 ， 下 面 是 一 种 
用 Ruby 实现 的 方法 : 
def to digits(n) 


previous digits = 
if nx 10 





else 
to digits(n / 10) 
end 


previous digits.push(n % 10) 
end 


还 没有 实现 <， 但 可 以 通过 使 用 n<=9 而 不 是 n<10 来 规避 这 个 问题 。 遗 憾 的 是 ， 我 们 没 法 
回避 实现 Fixnum#/ 和 Array#push， 下 面 是 它们 的 实现 : 














DIV = 
Z[->f{->m{->nft{ 
IF[IS LESS OR EQUAL[n][m]][ 


->x{ 
INCREMENT[f[ SUBTRACT[m][n]][n]][x] 
} 
1[ 
ZERO 
] 
}】} 
PUSH = 
->11{ 
->x{ 
FOLD[1] [UNSHIFT[EMPTY] [x] ] [UNSHIFT] 
} 


现在 可 以 把 楷 o_digits 转换 成 一 个 proc 了 : 


TO _DIGITS = 

Z[-> f { -> n { PUSH[ 
F[IS LESS OR EQUAL[n][DECREMENT[TEN]]][ 
EMPTY 





它 能 工作 吗 ? 
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>> to array(TO DIGITS[FIVE]).map { |p| to integer(p) } 

的 | 

>> to array(TO DIGITS[POWER[FIVE][THREE]]).map { |p| to integer(p) } 
二 [1， 2， 5] 








是 的 ， 可 以 工作 。 而 且 因为 我 们 已 经 预见 性 地 设计 了 一 种 字符 串 编码 ， 在 这 种 字符 串 编 码 
里 ，1 代表 '1 ， 以 此 类 推 ， 所 以 由 T0_DIGITS 产生 的 数组 已 经 是 有 效 的 字符 串 了 : 














>> to_string(TO DIGITS[FIVE]) 

-5r 

>> to_string(TO_DIGITS[POWER[FIVE][THREE]]) 
on 


因此 我 们 可 以 在 FizzBuzz 中 用 TO0_DIGITS 替换 其 o_ s， 


MAP[RANGE[ONE][HUNDRED]][-> n 
F[IS_ZERO[MOD[n][FIFTEEN]]] 
FIZZBUZZ 
IF[IS ZERO[MOD[n][THREE]]][ 
FIZZ 
IF[IS_ZERO[MOD[n][FIVE]]][ 
BUZZ 


{ 
[ 








TO_DIGITS[n] 








}] 


6.1.10 解决 方案 
我 们 最 终 完成 了 ! (这 可 能 是 有 史 以 来 最 长 的 、 最 笨拙 的 工作 面试 了 。) 现在 我 们 已 经 有 
了 完全 由 proc 写成 的 FizzBuzz 的 实现 。 来 运行 一 下 以 确保 它 正 常 工作 : 





>> solution = 
MAP[RANGE[ONE][HUNDRED]][-> n 
IF[IS_ZERO[MOD[n][FIFTEEN]]] 
FIZZBUZZ 
][IF[IS_ZERO[MOD[n][THREE]]][ 
FIZZ 


{ 
[ 


][IF[IS ZERO[MOD[n][FIVE]]]I 
BUZZ 


TO_DIGITS[n] 
]]] 


=> #<Proc (lambda)> 
>> to _array(solution).each do |p| 
puts to string(p) 
end; nil 





写 ， 我 们 认为 有 必要 把 


个 缩写 





经 历 了 这 么 多 麻烦 以 确保 每 一 个 常量 只 是 某 个 更 长 表达 式 的 


每 一 个 常量 用 它 的 定义 替换 ， 因 此 可 以 看 到 完整 的 程序 了 : 
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级 编程 技术 


构建 完全 由 proc 组 成 的 程序 需要 很 多 努力 ， 但 我 们 已 经 明白 只 要 不 介 
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成 实际 工作 是 可 能 的 。 来 快速 看 一 下 用 这 个 最 小 环境 写 代码 的 其 他 几 个 技术 。 


6.1.11 


太 





1. 无 限 流 

使 用 代码 表示 数据 有 一 些 有 趣 的 优点 。 我 们 基于 proc 的 列表 不 一 定 是 静态 的 : 列表 也 是 代 
码 ， 在 我 们 传递 它 给 FIRST 和 REST 时 它 能 做 正确 的 事情 ， 因 此 很 容易 实现 能 动态 计算 自身 
内 容 的 列表 ， 也 就 是 流 (stream)。 事 实 上 ， 流 没有 理由 是 有 限 的 ， 因 为 计算 只 需要 根据 需 
要 生成 列表 的 内 容 就 可 以 了 ， 所 以 它 可 以 一 直 无 限 产 生 新 的 值 。 


例如 ， 下 面 是 一 个 零 组 成 的 无 限 流 的 实现 : 


ZEROS = Z[-> f { UNSHIFT[f][ZERO] }] 


























中 这 是 ZEROS = UNSHIFT[ZEROS][ZERO] 的 “无 欺骗 ”版 本 ， 即 用 它 自身 定义 的 
心 。 数 据 结构 。 作 为 一 个 程序 员 ， 我 们 通常 会 觉得 用 自身 定义 一 个 递归 函数 的 思 
人 


~ 想 很 舒服 ， 但 用 自身 定义 一 个 数据 结构 看 起 来 很 怪异 ， 在 这 种 情况 下 ， 它 们 
几乎 是 同样 的 东西 ， 而 乙 组 合子 让 两 者 都 完全 合理 了 。 

















在 控制 台 上 ， 我 们 可 以 看 到 ZEROS 表现 得 就 像 一 个 列表 ， 尽 管 这 个 列表 看 不 到 尽头 : 





>> to_integer(FIRST[ZEROS]) 

=> 0 

>> to_integer(FIRST[REST[ZEROS]]) 

=> 0 

>> to integer(FIRST[REST[REST[REST[REST[REST[ZEROS]]]]]]) 
=> 0 


能 有 一 个 辅助 方法 把 这 个 流转 成 一 个 Ruby 的 数组 会 很 方便 ， 但 to_array 会 永远 运行 下 
去 ， 直 到 我 们 明确 地 让 这 个 转换 进程 停 下 来 为 止 。 一 个 可 选 的 “最 大 数 ” 的 参数 可 以 做 
到 这 一 点 : 


def to array(l1, count = nil) 
array = [] 


until to boolean(IS EMPTY[1]) || count == 
array.push(FIRST[1]) 


1 = REST[1] 
count = count - 1 unless count.nil? 
end 
array 
end 


这 让 我 们 可 以 从 流 中 获取 任意 数目 的 元 素 并 把 它们 转 成 一 个 数组 : 


>> to array(ZEROS, 5).map { |p| to integer(p) } 

六 [0， 0，0，0， 0] 

>> to array(ZEROS, 10).map { |p| to_integer(p) } 

三 [0， 0，0，0，0，0，0，0，0， 0] 

>> to array(ZEROS, 20).map { |p| to integer(p) } 

=> [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,， 0，0, 0] 
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ZER0S 不 会 每 次 都 对 一 个 新 的 元 素 进 行 计算 ， 但 做 起 来 也 非常 简单 。 下 面 是 一 个 从 给 定 值 


累加 的 流 : 











>> UPWARDS OF = Z[-> f { -> n { UNSHIFT[-> x { f[INCREMENT[n]][x] }][n] } }] 

=> #<Proc (lambda)> 

>> to _array(UPWARDS OF[ZERO], 5).map { |p| to integer(p) } 

a2 [0F S23s 4] 

>> to_array(UPWARDS OF[FIFTEEN], 20).map { |p| to integer(p) } 

=> [15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32,33，34] 














押 是 一 个 包含 一 个 给 定数 字 所 有 倍数 的 流 : 





>> MULTIPLES OF = 
-> mi 
Z[-> f { 
-> n { UNSHIFT[-> x { f[ADD[m][n]][x] }][n] } 
}][m] 


=> #<Proc (lambda)> 

>> to array(MULTIPLES OF[TWO], 10).map { |p| to integer(p) } 

3» [2 A037 .8 40 12 4 103.18 30 

>> to array(MULTIPLES OF[FIVE], 20).map { |p| to integer(p) } 

=> [5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100] 


我 们 可 以 像 其 他 列表 一 样 操纵 这 些 无 限 流 。 例 如 ， 可 以 通过 对 已 有 的 proc 映射 一 个 新 的 
proc 得 到 一 个 新 的 流 : 





>> to array(MULTIPLES OF[THREE], 10).map { |p| to integer(p) } 

=». [333.63 9 12 I, T82124 -27 30| 

>> to array(MAP[MULTIPLES OF[THREE]][INCREMENT], 10).map { |p| to integer(p) } 

=> [4, 7, 10, 13, 16, 19, 22, 25, 28,31] 

>> to array(MAP[MULTIPLES OF[THREE]][MULTIPLY[TWO]], 10).map { |p| to integer(p) } 
=> [6, 12, 18, 24, 30, 36, 42, 48, 54, 60] 


其 至 可 以 写 一 个 proc 把 两 个 流 组 合成 第 三 个 流 : 


>> MULTIPLY_STREAMS = 
Z[-> ff{ 
->k{->1t1{ 
UNSHIFT[-> x { f[REST[k]][REST[1]][x] }][MULTIPLY[FIRST[k]][FIRST[1]]] 
}} 


}] 
=> #<Proc (lambda)> 
>> to array(MULTIPLY STREAMS[UPWARDS OF[ONE]][MULTIPLES OF[THREE]], 10). 


map { |p| to integer(p) } 
=> [3, 12, 27, 48, 75, 108, 147, 192, 243，300] 


因为 流 的 内 容 能 由 任何 计算 生成 ， 所 以 我 们 创建 斐 波 那 契 数列 的 无 限 列表 ， 或 者 质数 ， 或 
者 按 字 母 顺序 的 所 有 可 能 的 字符 串 ， 或 者 任何 其 他 可 计算 的 东西 都 已 经 没有 障碍 了 。 这 个 
抽象 非常 强大 ， 除 了 已 有 的 特性 之 外 不 需要 任何 智能 的 特性 了 。 





























原始 Ruby 流 


Ruby 有 一 个 Enumerator 类 可 以 用 来 构建 无 限 的 流 ， 而 不 需要 依赖 proc。 下 面 是 “给 
定数 的 倍数 ”的 流 的 实现 方法 : 


def multiples_of(n) 
Enumerator.new do |yielder| 
value = n 
loop do 
yielder.yield(value) 
Value = value + N 
end 
end 
end 


这 个 方法 返回 一 个 Enumerator， 每 次 我 们 对 其 调用 #next， 它 都 会 执行 1oop 的 一 个 选 
代 并 返回 获得 的 值 : 

>> multiples of three = multiples_of(3) 

=> #<Enumerator: #<Enumerator: :Generator>:each> 

>> multiples of three.next 

=> 3 

>> multiples of three.next 

=> 6 

>> multiples of three.next 

=> 9 
Enumerator 类 包括 了 Enumerable 模块 ， 此 我 们 可 以 调用 #first、#take 和 #detect 
这 样 的 方法 : 

>> multiples of(3).first 

=> 3 

>> multiples of(3).take(10) 

= [3 "6 95, 12 1155 18, 21; :24.27;.30j 

>> multiples of(3).detect { |x| x > 100 } 

=> 102 
其 他 的 Enumerable 方法 ， 如 #map 和 #select， 在 这 个 Enumerator 上 没 法 正常 工作 ， 因 
为 它们 会 党 试 处 理 这 个 无 限 流 中 的 每 一 项 。 但 是 ，Ruby 2.0 的 Enumerator: :Lazy 类 重 
新 实现 了 一 些 Enumerable 方法 ， 这 样 它们 在 依赖 的 Enumerator 继续 计数 时 仍然 可 以 工 
作 。 我 们 可 以 通过 在 一 个 Enumerator 上 调用 机 azy 来 获得 一 个 Enumerator::Lazy， 然 
后 可 以 像 之 前 操纵 proc 有 版 本 一 样 操纵 这 些 无 限 流 : 

>> multiples of(3).1lazy.map { |x| x * 2 }.take(10).force 

=> [6, 12, 18, 24, 30, 36, 42, 48, 54, 60] 

>> multiples of(3).lazy.map { |x| x * 2 }.select { |x| x > 100 }.take(10).force 

=> [102, 108, 114, 120, 126, 132, 138, 144, 150,，156] 

>> multiples of(3).1lazy.zip(multiples of(4)).map { |a, b| a * b }.take(10).force 

=> [12，48，108，192，300，432，588，768，972，1200] 
与 基于 proc 的 列表 相 比 ， 这 不 是 很 整洁 (为 了 处 理 无 限 流 ， 我 们 得 写 一 些 特殊 的 代 
码 ， 而 不 能 只 是 像 通常 的 Enumerable 那样 处 理 ) ， 但 它 表 明 Ruby 确实 含有 处 理 这 些 不 
寻常 数据 结构 的 内 建 方式 。 
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2. 避免 随意 递归 


在 FizzBuzz 练习 里 ， 我 们 使 用 MOD 和 RANGE 这 样 的 递归 函数 展示 了 Z 组 合子 的 用 法 。 这 很 
方便 ， 因 为 它 让 我 们 从 一 个 没有 约束 的 递归 的 Ruby 实现 转换 成 一 个 基于 proc 的 实现 ， 而 
不 必 改 变 代 码 结构 ， 但 是 从 技术 上 讲 ， 没 有 乙 组 合子 我 们 也 可 以 利用 印 奇 数 的 行为 来 实现 


这 些 函 数 。 





例如 ，MOD[m][n] 的 实现 方法 是 ， 只 要 n<=m 就 不 断 地 从 nm 中 减 去 n， 并且 总 是 检查 这 个 条 

















多 做 几 次 也 无 碍 : 


def decrease(m, n) 
if n <= m 
m-n 
else 
m 
end 
end 


>> decrease(17, 5) 

=> 12 

>> decrease(decrease(17, 5), 5) 

= 

>> decrease(decrease(decrease(17, 5), 5), 5) 

=> 2 

>> decrease(decrease(decrease(decrease(17, 5), 5), 5), 5) 

=> 2 

>> decrease(decrease(decrease(decrease(decrease(17, 5), 5), 5), 5), 5) 
=> 2 





后 以 决定 是 否 进行 下 一 次 的 递归 调用 。 但 如 果 只 是 对 “如 果 n “= rm 就 从 mm 中 减 去 n” 这 
个 动作 执行 固定 的 次 数 ， 而 不 是 使 用 递归 动态 控制 这 个 重复 的 过 程 ， 也 可 以 得 到 同样 的 结 
果 。 我 们 不 知道 需要 重复 的 确切 次 数 ， 但 知道 m 次 肯定 够 了 〈 最 差 情 况 就 是 n 为 1)， 


而 且 


因此 我 们 可 以 重 写 MOD 以 利用 一 个 proc， 这 个 proc 的 参数 是 一 个 数 ， 它 或 是 从 这 个 数 中 减 
去 m (如 果 它 比 n 大 ) 或 是 直接 返回 这 个 数 。 这 个 proc 对 m 本 身 调用 m 次， 以 便 获得 最 终 





m{- 
m[-> x 1{ 
IF[IS LESS OR_EOUAL[n][x]][ 
SUBTRACT[x][n] 








>> to_integer(MOD[THREE][TWO]) 
3 4 
>> to_integer(MOD[ 

POWER[ THREE] [THREE] 


[ 
ADD[ THREE] [Two] 
]) 


=> 2 
尽管 这 个 实现 比 原来 的 实现 简单 ， 但 它 不 仅 难以 阅读 而 且 通常 效率 更 低 ， 因 为 它 总 是 会 执 
行 重复 调用 的 最 差 情况 下 的 次 数 而 不 是 尽 可 能 早 地 停 下 来 。 在 外 延 上 它 也 与 原来 的 实现 
不 等 价 ， 因 为 老 版 本 的 MOD 如 果 被 要 求 除 零 的 话 会 永远 循环 下 去 (条件 n<=m 永远 不 会 为 
false) ， 而 这 个 实现 只 是 返回 它 的 第 一 个 参数 : 





>> to_integer(MOD[THREE][ZERO]) 
> 


RANGE 更 有 挑战 一 些 ， 但 我 们 可 以 使 用 与 让 DECREMENT 工作 时 类 似 的 技巧 :设计 一 个 函数 ， 


在 对 某 个 初始 参数 调用 n 次 时 ， 它 会 从 预想 的 范围 里 返回 n 个 数 的 列表 。 就 像 DECREMENT 
一 样 ， 秘 诀 是 使 用 一 个 有 序 对 存储 结果 的 列表 和 在 下 一 个 迭代 中 需要 的 信息 : 





def countdown(pair) 
[pair.first.unshift(pair.last), pair.last - 1] 
end 


>> countdown([[]，10]) 

=> [[10], 9] 

>> countdown(countdown([[], 10])) 

三 2 [9; 10], 8] 

>> countdown(countdown(countdown([[], 10]))) 

这 [8， 9， 10]， 7] 

>> countdown(countdown(countdown(countdown([[]， 140])))) 
3 [[7) 8»:9,. 10];.6] 





Im 


重 写 proc 很 容易 : 





COUNTDOWN = -> p { PAIR[UNSHIFT[LEFT[p]][RIGHT[p]]][DECREMENT[RIGHT[p]]] } 











现在 我 们 只 需要 实现 RANGE 以 便 它 调用 COUNTDO 正确 的 次 数 (从 m 到 n 的 范围 内 总 是 有 
m-n+1 个 元 素 ) 并 从 最 终 的 有 序 对 中 取出 结果 列表 : 


RANGE = -> m { -> n { LEFT[INCREMENT[SUBTRACT[n][m]][COUNTDOwN][PAIR[EMPTY][n]]] } } 











这 个 无 组 合子 的 版 本 工作 得 也 很 好 : 


>> to array(RANGE[FIVE][TEN]).map { |p| to integer(p) } 
> [5， 6， 7 8， 9， 10] 
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赚 六 


可 以 通过 执行 事先 决定 好 次 数 的 迭代 来 实现 MOD 和 RANGE 一 一 而 不 是 执行 一 
全 
MY 

4 






































、 个 会 一 直 运行 直到 条 件 变 为 true 才 停止 的 任意 的 循环 一 一 因为 它们 是 原始 着 
上 归 函 数 。 参 见 7.2 节 可 以 了 解 更 多 内 容 。 


6.2 ”实现 lambda 演 算 
FizzBuzz 实现 已 经 让 我 们 对 用 无 类 型 的 lambda 演算 写 程序 有 了 一 些 感觉 。 这 些 限制 迫使 
我 们 从 零 开始 实现 大 量 的 基本 功能 而 不 是 依赖 语言 的 特性 ， 但 我 们 确实 成 功 构 建 了 解决 这 
个 问题 所 需要 的 数据 结构 和 算法 。 











因为 还 没有 lambda 演算 的 解释 器 ， 所 以 还 没有 真正 写 演算 的 程序 呢 。 我 们 只 是 在 用 
lambda 演算 的 形式 写 Ruby 程序 ， 以 此 获得 这 样 一 个 小 语言 能 工作 的 感觉 。 但 我 们 已 经 有 
了 构建 lambda 演算 解释 器 并 用 其 对 实际 的 lambda 演算 表达 式 求 值 的 所 有 知识 ， 那 来 尝试 
一 下 吧 。 











6.2.1 语法 

无 类 型 的 lambda 表达 式 是 一 种 编程 语言 ， 它 只 有 三 种 表达 式 : 变量 、 函 数 定义 以 及 调用 。 
我 们 不 再 引入 一 种 新 的 lambda 表达 式 语 法 ， 而 是 还 遵守 Ruby 的 习惯 (变量 看 起 来 像 x， 
函数 看 起 来 像 ->x{x}， 而 调用 看 起 来 像 是 x[y])， 并 尽量 不 让 两 种 语言 混 清 。 











圭 全 











为 什么 是 “lambda 演算 ”? 

4 

AN 说 > 2 一 | ww [= Wr 

外 在 这 个 上 下 文中 ， 单 词 演算 (calculus) 的 意思 是 一 个 操纵 符号 字符 串 的 规则 
系统 。7lambda 演算 的 原始 语法 用 的 是 希腊 字母 lambda (X ) 代替 Ruby 中 的 
-> 符号。 例如，ONE 会 写成 和 p. 入 x.p Xx。 














我 们 可 以 用 常见 的 方式 实现 LCVariable、LCFunction 和 LCCall 类 ， 


class LCVariable «< Struct.new(:name) 
def to s 
name.to_s 
end 


def inspect 
to s 
end 
end 


class LCFunction < Struct.new(:parameter, :body) 
def to s 





注 7: 大 多 数 人 把 它 与 微 积 分 学 联系 起 来 ， 这 是 一 个 数学 函数 中 关于 改变 率 和 数量 累加 率 的 系统 。 
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"-> #{parameter} { #{body} }" 
end 


def inspect 
eo 
end 
end 


class LCCall < Struct.new(:left, :right) 
def to s 
"#{left}[#{right}]" 
end 


def inspect 
to s 
end 
end 


这 些 类 可 以 让 我 们 构建 lambda 演算 表达 式 的 抽象 语法 树 ， 就 像 第 2 章 的 Simple 和 第 3 章 
的 正则 表达 式 那 样 : 


>> one = 
LCFunction.new(:p， 
LCFunction.new(:X， 
LCCall.new(LCVariable.new(:p), LCVariable.new(:x)) 
) 


) 
=> ->p{->x{plx]}} 
>> increment = 
LCFunction.new(:n， 
LCFunction.new(:p， 
LCFunction.new(:X， 
LCCall.new( 
LCVariable.new(:p), 
LCCall.new( 
LCCall.new(LCVariable.new(:n), LCVariable.new(:p)), 
LCVariable.new( :x) 
) 
) 
) 
) 
) 
=> ->n{->p{->x{plnipllx]] } }} 
>> add = 
LCFunction.new( :my 
LCFunction.new(:n, 
LCCall.new(LCCall.new(LCVariable.new(:n), increment), LCVariable.new(:m)) 
) 
) 
=> ->m{->n{nl->n{->p{->x {plntpj[x]] } } HIm] } } 


因为 这 种 语言 有 这 样 小 的 语法 ， 所 以 那 三 个 类 足以 表示 任意 的 lambda 演算 的 程序 了 。 
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6.2.2 语义 

现在 通过 为 每 个 语法 类 实现 一 个 拉 educe 方法 来 为 lambda 演算 赋予 一 个 小 步 操作 语义 。 小 
步 操作 语义 是 一 个 很 有 吸引 力 的 选择 ， 因 为 它 能 让 我 们 看 到 求 值 的 每 一 步 ， 这 在 Ruby 表 
达 式 中 是 没 法 轻易 做 到 的 。 


1. 替换 变量 
在 实现 #reduce 之 前 ， 我 们 需要 另 一 个 叫 作 拉 epjlace 的 操作 ， 它 能 找到 一 个 表达 式 里 的 一 
个 特定 变量 并 用 另 一 个 表达 式 替 换 它 ; 











class LCVariable 
def replace(name, replacement) 
if self.name == name 
replacement 
else 
self 
end 
end 
end 





class LCFunction 
def replace(name, replacement) 
if parameter == name 
self 
else 
LCFunction.new(parameter, body.replace(name, replacement)) 
end 
end 
end 


class LCCall 
def replace(name, replacement) 
LCCall.new(left.replace(name, replacement), right.replace(name, replacement)) 
end 
end 


对 于 变量 和 调用 ， 它 的 工作 方式 很 明显 : 





>> expression = LCVariable.new(:x) 
=> X 
>> expression.replace(:x, LCFunction.new(:y, LCVariable.new(:y))) 
=> ->y{y} 
>> expression.replace(:z, LCFunction.new(:y, LCVariable.new(:y))) 
=> X 
>> expression = 
LCCall.new( 
LCCall.new( 
LCCall .new( 
LCVariable. new(:a), 
LCVariable.new(:b) 
)， 





LCVariable.new(:c) 
)， 
LCVariable.new(:b) 


) 
=> a[b]j[c][p] 
>> expression.replace(:a, LCVariable.new(:x)) 
=> x[b]J[c][b] 
>> expression.replace(:b, LCFunction.new(:x, LCVariable.new(:x))) 


=> al-> x { x HIcl[l->x{ x} 


对 于 函数 ， 情 况 会 更 复杂 。#replace 只 能 对 一 个 函数 的 函数 体 起 作用 ， 而 且 它 只 能 替换 自 
由 变量 一 一 自由 变量 就 是 在 函数 范围 内 但 是 没有 被 声明 为 冰 数 参数 的 变量 : 





>> expression = 
LCFunction.new(:y， 
LCCall.new(LCVariable.new(:x), LCVariable.new(:y)) 





) 
=> -> y { x[y] } 
>> expression.replace(:x, LCVariable.new(:7z)) 
=> ->y {zl[ly] } 
>> expression.replace(:y, LCVariable.new(:7z)) 
=> -> y { x[y] } 


这 让 我 们 可 以 替换 掉 整 个 表达 式 中 的 同一 个 变量 ， 而 不 会 不 小 心 改变 正好 有 相同 名 字 的 无 关 


三 间 
变量 : 








>> expression = 
LCCall.new( 
LCCall.new(LCVariable.new(:x), LCVariable.new(:y)), 
LCFunction.new(:y, LCCall.new(LCVariable.new(:y), LCVariable.new(:x))) 


) 
=> x[y]j[-> y { y[x] }] 
>> expression.replace(:x, LCVariable.new(:7z)) 


=> z[yj[->y{y[zl }] © 


>> expression.replace(:y, LCVariable.new(:7z)) 


=> x[z[->y{y[ }] @ 
@ 在 原始 表达 式 中 x 都 是 自由 的 ， 所 以 它们 都 被 替换 掉 了 。 


只 有 第 一 次 出 现 的 y 才 是 自由 变量 ， 因 此 只 有 它 被 替换 掉 了 。 第 二 个 y 是 个 国 数 参数 ， 
不 是 变量 ， 而 第 三 个 y 是 一 个 属于 那个 函数 的 变量 ， 所 以 不 应 该 碰 它 。 











简单 的 拉 eplace 实现 在 革 些 输入 下 不 能 工作 。 它 无 法 正确 地 处 理 含有 自由 变 
一 E> 量 的 标 换 : 


>> expression = 
LCFunction.new(:X， 
LCCall.new(LCVariable.new(:x), LCVariable.new(:y)) 














=> -> x { x[y] } 
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>> replacement = LCCall.new(LCVariable.new(:z)，LCVariable.new(:X)) 
=> z[x] 
>> expression.replace(:y, replacement) 


=> -> x{ x[z[x]] } 
像 那样 只 是 把 z[x] 粘贴 进 -> x { .…. } 的 函数 体内 是 不 行 的 ， 因 为 z[x] 中 
的 x 是 一 个 自由 变量 ， 在 处 理 完 之 后 应 该 保持 不 变 ， 但 在 这 里 ， 它 恰好 被 同 
名 的 函数 参数 捕获 了 。 









































我 们 可 以 忽略 这 个 缺陷 ， 因 为 我 们 将 只 对 不 含 任何 自由 变量 的 表达 式 求 值 ， 
因此 实际 上 它 不 会 产生 任何 问题 ， 但 是 要 注意 ， 一 般 情 况 下 ， 需 要 一 种 更 为 
复杂 的 实现 。 


























2. 调用 函数 

方法 #feplace 的 作用 就 是 给 我 们 一 种 实现 函数 调用 语义 的 方式 。 在 Ruby 中 ， 在 用 一 个 或 
者 多 个 参数 调用 proc 的 时 候 ，proc 的 主体 会 得 到 求 值 ， 在 这 个 环境 下 每 个 参数 都 被 赋值 给 
了 一 个 本 地 变量 ， 因 此 每 次 使 用 变量 时 都 像 用 参数 本 身 一 样 。 这 暗示 着 ， 用 参数 1 和 2 调 
用 proc->x，y {x + y} 会 产生 中 间 表 达 式 1+2， 它 是 为 了 产生 最 终结 果 所 要 求 值 的 表达 式 。 














在 lambda 演算 中 我 们 可 以 应 用 同样 的 思想 ， 在 对 一 个 调用 求 值 的 时 候 赫 换 一 个 函数 体内 
的 变量 。 为 此 ， 我 们 可 以 定义 一 个 LCFunction#call 方法 ， 这 个 方法 进行 替换 并 返回 结果: 





class LCFunction 
def call(argument) 
body.replace(parameter, argument) 
end 
end 


这 让 我 们 可 以 模拟 一 个 函数 被 调用 的 时 刻 : 


>> function = 
LCFunction.new(:x, 
LCFunction.new(:y, 
LCCall.new(LCVariable.new(:x), LCVariable.new(:y)) 
) 
) 
= > ->x{->y{x[ly]}} 
>> argument = LCFunction.new(:z, LCVariable.new(:z)) 
02572 于 
>> function.call(argument) 


人 


3. 规约 表达 式 
在 对 一 个 lambda 演算 程序 求 





全 





的 时 候 ， 函 数 调用 是 唯一 实际 发 生 的 事情 ， 因 此 现在 我 们 









































注 8: 正确 的 行为 是 自动 改 掉 函 数 参 数 的 名 字 ， 这 样 就 避免 与 任何 自由 变量 冲突 了 : ->x{ x[y] } 改写 为 等 
价 的 表达 式 ->w { w[y] }， 然 后 再 安全 地 执行 替换 ， 得 到 ->w { w[z[x]] }， 而 x 仍 然 是 自由 变量 。 










































































准备 实现 #7eplace。 它 会 找到 表达 式 中 函数 调用 能 发 生 的 地 方 ， 然 后 使 用 #call 方法 使 图 
数 调用 发 生 。 我 们 只 需要 能 识别 哪些 表达 式 是 实际 能 调用 的 …… 








class LCVariable 
def callable? 
false 
end 
end 


class LCFunction 
def callable? 
true 
end 
end 


class LCCall 
def callable? 
false 
end 
end 


vg 然后 就 可 以 写 #reduce 了 : 


class LCVariable 
def reducible? 
false 
end 
end 


class LCFunction 
def reducible? 
false 
end 
end 


class LCCall 
def reducible? 


left.reducible? || right.reducible? || left.callable? 
end 


def reduce 
if left.reducible? 
LCCall.new(left.reduce, right) 
elsif right.reducible? 
LCCall.new(left, right.reduce) 
else 
left.call(right) 
end 
end 
end 




















在 这 个 实现 中 ， 函 数 调用 是 唯一 一 种 能 被 规约 的 语法 。 规 约 LCCall 有 点 像 规约 SIMPLE 里 
的 Add 或 Multiply: 如 果 其 中 有 一 个 子 表达 式 可 以 规约 ， 我 们 就 对 其 规约 ， 如 果 都 不 能 规 








从 零 开始 编程 | 189 





约 ， 我 们 就 通过 以 右边 的 子 表达 式 作为 左边 子 表达 式 (应 该 是 一 个 LCFunction) 的 参数 调 
用 左边 的 子 表达 式 来 实际 执行 调用 。 这 个 策略 称 为 值 调用 求 值 一 首先 我 们 把 参数 规约 成 
一 个 不 可 规约 的 值 ， 然 后 再 执行 调用 。 


使 用 lambda 演算 来 计算 一 下 “ 











加 一 ”， 以 此 来 测试 我 们 的 实现 : 
>> expression = LCCall.new(LCCall.new(add, one), one) 
=> -> m{ -> n {n> nf{ -> p{-> x{ pnpl[x]] } } Im] } }-> p { -> x {plx] } 
}[-> p { -> x { p[x] })] 
>> while expression.reducible? 

puts expression 

expression = expression.reduce 

end; puts expression 


->m{->nf{n 


ee p {->x{plnp][xl] } } }l[m] } }[->p { ->x {Pp[lx] } 1} 
xX 
->p{->x{plnpjlxl] } } }[->p{->x{Pplx] }}] }->p{->x 





好 吧 ， 有 些 事情 确实 发 生 了 ， 不 过 我 们 没 得 到 想 要 的 结果 : 最 终 的 表达 式 是 -> p { -> x 
{ p[->p { -> x { p[x] } }[pj[x]] } }, 但 数字 “二 ”的 lambda 演算 表示 应 该 是 -> p 
{ -> x{ p[p[x]] } })]。 哪 里 错 了 呢 ? 








错误 是 由 我 们 使 用 的 求 值 策略 引起 的 。 结 果 里 还 有 可 规约 的 函数 调用 一 一 例如 调用 -> p 
{ -> x { p[x] } Lpj] 可 以 被 规约 成 -> x { plx] 盖 一 但 机 educe 没有 接触 到 它们 ， 因 为 
它们 是 在 一 个 函数 体内 出 现 的 ， 而 我 们 的 语义 不 会 把 函数 处 理 成 可 规约 的 。” 








但 是 ， 就 像 前 面 6.1.1 市 中 “相等 ”部 分 讨论 的 一 样 ， 两 个 具有 不 同 语法 的 表达 式 如 果 有 
同样 的 行为 仍然 被 认为 是 相等 的 。 我 们 知道 数字 “二 ”的 lambda 演算 表达 式 应 该 是 ， 如 
果 我 们 给 它 两 个 参数 ， 它 会 对 第 二 个 参数 调用 第 一 个 参数 两 次 。 让 我 们 试 着 用 两 个 改造 过 
的 变量 inc 和 zero" 调用 表达 式 ， 然 后 看 一 下 它 实际 在 做 什么 : 





>> inc, zero = LCVariable.new(:inc), LCVariable.new(:zero) 

=> [inc, zero] 

>> expression = LCCall.new(LCCall.new(expression, inc), zero) 
=> ->p{->x{pl->p{->x{p[Lx]}}pllx]l] } }lincllzero] 


>> while expression.reducible? 





注 9: 为 了 修正 这 个 问题 ， 我 们 可 以 重新 实现 #educe 方法 ， 使 用 更 激进 的 求 值 策略 (如 应 用 序 求 值 或 者 正 

则 序 求 值 ) 对 函数 体 执行 规约 ， 但 处 理 单一 函数 体 时 通常 都 包含 自由 变量 ， 所 以 需要 一 个 #7eplace 

的 更 健壮 的 实现 。 

注 10: 我 们 对 含有 自由 变量 inc 和 zero 的 表达 式 求 值 是 在 冒险 ,但 幸运 的 是 ， 表 达 式 中 没有 一 个 函数 含有 
这 些 名 字 的 参数 ， 因 此 在 这 个 特例 中 ， 不 管 哪个 变量 被 意外 捕获 都 不 会 有 危险 。 







































































puts expression 
expression = expression.reduce 
end; puts expression 


->p{->x{pl->p{->x{p[lx]}}pj[lx]l] } }linc]jlzero] 
-> x {incl-> p { -> x { p[x] } }linc][x]] }[zero] 

inc[-> p { -> x { p[x] } }inc][zero]] 

inc[-> x { inc[x] }[zero]] 


inc[inc[zero]] 
=> Nil 


这 恰好 是 我 们 希望 数字 “二 ”所 要 表现 的 行为 ,因此 尽管 -> p { ->x {pl->p{->x 
{ pLx] } }[pJLx]] } } 看 起 来 与 期 望 的 不 同 ， 但 毕 竞 
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这 
坊 
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6.2.3 语法 分 析 
既然 已 经 有 了 工作 语义 ， 我 们 就 通过 为 lambda 演算 表达 式 构 建 一 个 语法 解析 器 来 结束 工 
作 。 像 往常 一 样 ， 我 们 可 以 使 用 Treetop 来 写 语 法 : 








grammar LambdaCalculus 
rule expression 
calls / variable / function 


end 
rule calls 
first: (variable / function) rest:('[' expression ']')+ { 
def to ast 
arguments.map(&:to ast).inject(first.to ast) { |1, r| LCCall.new(l, r) } 
end 


def arguments 
rest.elements.map(&:expression) 
end 


} 


end 


rule variable 
(azle{ 
def to ast 
LCVariable.new(text value.to sym) 
end 


} 


end 


rule function 


'-> ' parameter:[a-z]+ ' { ' body:expression ' }' { 
def to ast 
LCFunction.new(parameter. text value.to sym, body.to ast) 
end 
} 
end 


end 
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就 像 在 2.6 节 中 讨论 的 那样 ，Treetop 语法 一 般 会 产生 右 结 合 的 树 ， 因 此 为 
了 适应 lambda 演算 的 左 结合 函数 调用 语法 ， 这 个 语法 得 做 一 些 额 外 的 工作 。 
这 个 调用 匹配 一 个 或 者 多 个 连续 的 调用 (如 alb][c]j[d])， 而 得 到 的 具体 语 
法 树 节点 的 批 o_ast 方法 使 用 Enumerable#inject 把 这 些 调用 的 参数 转 成 一 个 
左 结合 的 抽象 语法 树 。 














这 个 解析 器 和 操作 语义 一 起 给 出 了 lambda 演算 的 完整 实现 ， 这 允许 我 们 读 取 表 达 式 并 对 














其 求 值 : 


require 'treetop' 

true 

Treetop.1o0ad('lambda calculus') 

LambdaCalculusParser 

parse tree = LambdaCalculusParser.new.parse('-> x { x[x] }[->y {y+}]') 

SyntaxNode+Calls2+Calls1 offset=0, "...}[-> y {y }]" (to ast,arguments,first,rest): 
SyntaxNode+Function1+Function0 offset=0, "... x { x[x] }" (to ast,parameter,body): 

SyntaxNode offset=0, "-> " 

SyntaxNode offset=3, "x": 

SyntaxNode offset=3, "x 
SyntaxNode offset=4, " { 
SyntaxNode+Calls2+Calls1 offset=7, "x[x]" (to ast,arguments,first,rest): 

SyntaxNode+Variable0 offset=7, "x" (to ast): 

SyntaxNode offset=7, "x" 
SyntaxNode offset=8, "[x]": 
SyntaxNode+Calls0O offset=8, "[x]" (expression): 
SyntaxNode offset=8, "[" 
SyntaxNode+Variable0 offset=9, "x" (to ast): 
SyntaxNode offset=9, "x" 
SyntaxNode offset=10, "]" 
SyntaxNode offset=11, " }" 
SyntaxNode offset=13, "[->y{y}]": 
SyntaxNode+Cal1s0 offset=13, "[-> y { y }]" (expression): 
SyntaxNode offset=13, "[" 
SyntaxNode+Function1+Function0 offset=14, "... {y }" (to ast,parameter,body): 
SyntaxNode offset=14, "-> " 
SyntaxNode offset=17, "y": 
SyntaxNode offset=17, "y 
SyntaxNode offset=18, " { " 
SyntaxNode+Variable0 offset=21, "y" (to ast): 
SyntaxNode offset=21, "y" 
SyntaxNode offset=22, " }" 
SyntaxNode offset=24, "]" 
expression = parse tree.to ast 
-> x {x[x] }[->y{y}] 
expression.reduce 


->y{y}->y{y}] 
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我 们 在 世上 见 到 的 大 多 数 错综复杂 的 事物 都 来 自 于 复杂 的 系统 ， 比 如 哺乳 动物 、 微 处 理 
器 、 经 济 、 天 气 ， 所 以 很 自然 地 以 为 简单 的 系统 只 能 做 简单 的 事情 。 但 在 本 书 中 ， 我 们 已 
经 看 到 ， 简 单 的 系统 可 以 拥有 强大 的 功能 ， 例 如 第 6 章 表明 ， 即 使 一 种 很 小 的 编程 语言 
有 足够 的 能 力 去 做 有 用 的 工作 ， 而 第 5 章 勾 勒 出 了 一 台 通 用 图 灵机 的 设计 ， 它 可 以 读 取 描 
述 另 一 台 机 器 的 编码 ， 然 后 模拟 其 执行 。 



































通用 图 灵机 的 存在 是 极其 有 意义 的 。 尽 管 任 何 一 台 个 体 的 图 灵机 都 有 一 个 硬 编码 的 规则 手 
册 ， 但 是 通用 图 灵机 证 明了 设计 这 样 一 个 装置 的 可 能 性 ， 这 个 装置 可 以 通过 从 纸 带 读 取 指 
令 来 完成 任何 任务 。 这 些 指令 实际 上 是 控制 机 器 硬件 运行 的 软件 ， 就 像 控 制 我 们 每 天 都 在 
使 用 的 通用 可 编程 计算 机 的 软件 一 样 "。 有 限 和 下 推 自动 机 有 点 过 于 简单 ， 不 能 支持 这 种 
全 面 的 可 编程 性 ， 但 是 图 灵机 具有 解决 这 个 问题 的 足够 的 复杂 性 。 


















































这 一 章 里 ， 我 们 将 探寻 几 个 简单 的 系统 ， 并 将 看 到 它们 都 是 通用 的 一 所 有 这 些 系统 都 具 
有 模拟 图 灵机 的 能 力 ， 因 此 都 能 够 执行 所 输入 的 任意 程序 ， 而 无 需 硬 编码 一 一 这 表明 通用 
性 比 我 们 预期 的 要 常见 得 多 。 





7.1 lambda 演算 
我 们 已 经 看 到 ，lambda 演算 是 一 种 可 用 的 编程 语言 ， 但 还 没有 探讨 它 是 否 与 图 灵机 一 样 强 








注 1:“ 硬 件 ” 指 的 是 读 / 写 头 、 纸 带 和 规则 手册 。 因 为 图 灵机 通常 只 是 一 个 思维 实验 品 而 不 是 物理 实体 ， 
所 以 从 表面 上 来 讲 它们 不 是 硬件 ,但 与 写 在 纸 带 上 的 以 字符 形式 存在 的 一 直 在 改变 的 “ 软 ” 信 息 相 比 ， 
它们 是 系统 中 一 个 固定 的 部 分 ， 从 这 个 意义 上 讲 ， 它 们 是 “ 硬 的 ”。 
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大 。 事 实 上 ，lambda 演算 一 定 至 少 有 那么 强大 ， 因 为 它 能 够 模拟 包括 通用 图 灵机 (当然 包 
括 ) 在 内 的 任何 图 灵机 。 

















我 们 将 用 lambda 演算 快速 地 实现 一 台 图 灵机 的 一 部 分 
拟 图 灵机 的 。 





纸 带 ， 来 领略 一 下 它 是 如 何 模 





就 像 在 第 6 章 一 样 ， 我 们 仍 将 采用 Ruby 代码 来 方便 快捷 地 表示 lambda 演 
全 4 、 算 ， 当 然 这 些 代码 只 限于 创建 proc、 调 用 proc 和 使 用 常量 做 缩 略 词 。 














因为 Ruby 不 是 我 们 应 该 研究 的 语言 ， 所 以 使 用 它 有 点 冒险 。 但 这 样 做 换 来 
的 是 一 个 熟悉 的 表达 式 语 法 和 一 种 对 表达 式 求 值 的 简单 方法 。 并 且 ， 只 要 保 
持 前 面 的 约束 ， 我 们 的 发 现 就 将 是 有 效 的 。 














一 台 图 灵机 的 纸 带 有 4 个 属性 : 出 现在 纸 带 左边 的 字符 列表 、 纸 带 中 间 的 字符 (处 于 图 灵 
机 读 / 写 头 的 位 置 )、 右 侧 的 字符 列表 ， 以 及 被 当成 空白 的 字符 。 我 们 可 以 把 这 4 个 值 表示 
成 pair 的 pair。 





TAPE =-->1{->mf->rf{f->b{fpPAIRPAIRILI][m]][PAIR[r][bj] } } } } 
TAPE LEFT = -> t { LEFT[LEFT[t]] } 

TAPE MIDDLE = -> t { RIGHT[LEFT[t]] } 

TAPE RIGHT = -> t { LEFT[RIGHT[t]] } 

TAPE BLANK = -> t { RIGHT[RIGHT[t]] } 


作为 “构造 函数 ”"，TAPE 用 纸 带 的 4 个 属性 作为 参数 并 返回 一 个 代表 纸 带 的 proc。TAPE_ 
LEFT、TAPE_MIDDLE、TAPE_RIGHT 和 TAPE_BLANK 是 “访问 函数 "， 可 以 根据 纸 带 状态 的 一 个 表 
示 来 取得 对 应 的 属性 。 








有 了 这 个 数据 结构 ， 我 们 就 可 以 实现 TAPE_WRITE。TAPE_WRITE 把 一 个 纸 带 和 一 个 字符 作为 
输入 参数 ， 返 回 一 个 中 间 位 置 写 有 字符 的 新 纸 带 : 


TAPE WRITE = > t { -> c { TAPE[TAPE LEFT[t]][c][TAPE RIGHT[t]][TAPE BLANK[t]] } } 








我 们 还 可 以 定义 移动 纸 带 头 的 操作 。TAPE_MOVE_HEAD_RIGHT 这 个 proc 直接 从 5.1.4 节 里 
Tape#move_head_right 的 无 限制 的 Ruby 实现 转换 而 来 ， 它 能 够 把 纸 带 头 右 移 一 个 方 格 *: 





TAPE_MOVE HEAD RIGHT = 
->tt 
TAPE[ 
PUSH[TAPE LEFT[t]][TAPE MIDDLE[t]] 


IF[IS EMPTY[TAPE RIGHT[t]]]I[ 
TAPE BLANK[t] 
][ 





注 2: TAPE_MOVE_HEAD_LEFT 的 实现 类 似 ， 只 是 要 求 一 些 没 有 在 6.1.8 市 中 额外 定义 的 列表 操作 函数 。 











A 
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FIRST[TAPE RIGHT[t]] 

F[IS EMPTY[TAPE RIGHT[t]]][ 
EMPTY 

REST[TAPE RIGHT[t]] 

][ 


] 
} 








TAPE BLANK[t] 


总 而 言 之 ， 这 些 操 作 给 予 了 我 们 创建 纸 带 、 对 纸 带 进行 读 写 并 来 回 移动 纸 带 头 所 需要 的 一 
切 。 例 如 ， 我 们 可 以 从 一 个 空 的 纸 带 开始 ， 然 后 在 连续 的 方 格 内 写 入 一 串 数 字 。 














>> current tape = TAPE[EMPTY][ZERO][EMPTY][ZERO] 


=> #<Proc (lambda)> 
>> current tape 
=> #<Proc (lambd 
>> current tape 
=> #<Proc (lambd 
>> current tape 
=> #<Proc (lambd 
>> current tape 
=> #<Proc (lambd 
>> current tape 
=> #<Proc (lambd 
>> current tape 
=> #<Proc (lambd 


TAPE_WRITE[current tape][ONE] 

> 

TAPE_ MOVE HEAD RIGHT[current tape] 
> 

TAPE_WRITE[current tape][TAO] 


> 
TAPE_MOVE_ HEAD RIGHT[current tape] 
S 

TAPE WRITE[current tape][THREE] 

>» 

TAPE MOVE_ HEAD RIGHT[current tape] 
> 











[SV | 


>> to array(TAPE LEFT[current tape]).map { |p| to integer(p) } 


了 [1， 2，3 





>> to integer(TAPE MIDDLE[current _tape] ) 

=> 0 

>> to array(TAPE RIGHT[current tape]).map { |p| to integer(p) } 
=> [] 


我 们 将 跳 过 其 他 细节 ， 但 是 继续 像 这 样 基于 proc 来 构建 对 状态 、 配 置 、 规 则 和 规则 手册 的 











表示 关 


F 不 困难 。 有 了 全 部 这 些 ， 我 们 就 可 以 写 出 只 基于 proc 的 DTM#step 和 DTM#run 的 实 





二 








现 : 51 





TEP 通过 对 一 个 配置 应 用 规则 手册 并 生成 另外 一 个 配置 ， 模 拟 了 一 台 


狠 




















灵机 的 一 步 ， 


而 RUN 会 使 用 乙 组 合子 反复 调用 STEP， 直 到 没有 规则 可 用 或 机 器 到 达 停 机 状态 ， 这 样 就 模 
拟 了 一 台 机 器 的 完整 执行 。 


换 句 话说，RUN 是 一 个 可 以 模拟 任何 图 灵机 的 lambda 演算 程序 。 事 实证 明 ， 相 反 的 情况 
也 是 可 能 的 : 就 像 6.2.2 节 所 描述 的 ， 通 过 在 纸 带 上 存储 一 个 lambda 表达 式 的 描述 ， 并 不 
断根 据 一 系列 规约 规则 对 其 进行 修改 ， 一 台 图 灵机 可 以 作为 lambda 演算 的 解释 器 。 


























注 3: 术语 图 灵 完 备 经 常用 来 描述 一 个 系统 或 者 一 种 编程 语言 能 模拟 任何 图 灵机 。 
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ve 丸 为 每 一 台 图 灵机 都 能 由 lambda 演算 程序 模拟 ， 而 每 一 个 lambda 演算 程序 
《人心 4 、 也 能 被 一 台 图 灵机 模拟 ， 所 以 这 两 个 系统 是 完全 等 价 的 。 这 个 结果 很 令 人 吃 








镀 ， 惊 ， 因 为 图 灵机 和 lambda 演算 程序 以 完全 不 同 的 方式 工作 ， 我 们 此 前 没有 
料 到 它们 竟然 具有 同样 的 能 


这 意味 着 至 少 有 一 种 方式 可 以 模拟 lambda 演算 本 身 : 首先 使 用 lambda 演算 实现 一 台 图 灵 
机 ， 然 后 使 用 这 人 台 模 拟 出 来 的 机 器 运行 lambda 解释 器 。“ 模 拟 机 中 再 模拟 ”是 一 种 低 效 的 
做 事 方式 。 我 们 可 以 通过 设计 数据 结构 表示 lambda 演算 表达 式 ， 然 后 直接 实现 运算 语义 
达到 同样 目的 。 但 这 确实 表明 lambda 演算 不 必 再 创建 任何 新 的 东西 就 肯定 是 通用 的 了 。 
自 解释 器 是 通用 图 灵机 的 lambda 演算 版 本 : 即使 底层 的 解释 程序 是 固定 的 ， 我 们 也 可 以 
通过 提供 合适 的 lambda 表达 式 作为 输入 来 让 它 做 任何 工作 。 


如 前 所 述 ， 通 用 系统 的 真正 好 处 是 它 能 被 编程 以 执行 不 同 的 任务 ， 而 不 是 总 要 硬 编码 来 。 
特别 地 ， 通 用 系统 能 被 编程 来 模拟 任何 其 他 的 通用 系统 ， 通 用 图 灵机 能 计算 lambda 演算 
表达 式 的 值 ， 而 lambda 演算 解释 器 也 能 模拟 图 灵机 。 


7.2 ”部 分 递归 函数 


lambda 演算 表达 式 完全 由 procs 的 创建 和 调用 组 成 ， 部 分 递归 函数 与 其 大 致 相同 ， 由 四 个 
部 分 组 合 构成 。 前 两 部 分 叫 作 zero 和 increment， 我 们 可 以 使 用 Ruby 实现 它们 。 
























































def zero 
0 
end 


def increment(n) 
n+1 
end 


这 两 个 方法 很 直观 ， 分 别 返 回 数字 0 和 往 一 个 数字 上 加 1: 


>> zero 

=> 0 

>> increment(zero) 

=> 1 

>> increment(increment(zero)) 
= 这 








下 面 使 用 #zero 和 提 ncrement 来 定义 一 些 新 方法 : 











>> def two 
increment(increment(zero)) 
end 
= 





>> two 
=> 2 
>> def three 
increment (two) 
end 
=> Nil 
>> three 
=> 3 
>> def add three(x) 
increment(increment(increment (x))) 
end 
=> nil 
>> add three(two) 
=> 5 


第 三 个 方法 #fecurse 更 为 复杂 : 


def recurse(f, g, *values) 
*other values, last value = values 


if last value.zero? 
send(f, *other values) 
else 
easier last value = last value - 1 
easier values = other values + [easier last value] 


easier result = recurse(f, g, *easier values) 
send(g, *easier values, easier result) 
end 
end 





方法 机 ecurse 用 两 个 方法 的 名 字 和 &g 作为 参数 ， 并 且 使 用 它们 对 一 些 输 入 值 执行 递归 计 
算 。 根 据 最 后 的 输入 值 ， 调 用 拉 ecurse 的 直接 结果 是 通过 委托 给 f 或 者 计算 得 出 的 。 


。 如 果 最 后 的 输入 值 是 零 ， 抽 ecurse 把 其 他 值 作为 参数 ， 调 用 名 为 f 的 方法 。 

。 如 果 最 后 的 输入 不 是 零 , #recurse 使 其 递减 , 并 用 修改 之 后 的 输入 值 作为 参数 调用 自身 ， 
然后 用 那些 相同 的 值 和 递归 调用 的 结果 调用 名 为 g 的 方法 。 

这 了 听 起 来 比 实际 复杂 ; #7recurse 只 不 过 是 定义 某 种 递归 函数 的 模板 。 比 如 ， 我 们 可 以 


用 其 定义 一 个 函数 #add， 这 个 函数 带 有 两 个 参数 x 和 y， 它 把 它们 加 到 一 起 。 为 了 使 用 
#ecurse 构建 此 函数 ， 我 们 需要 实现 两 个 其 他 的 函数 ， 以 回答 下 面 这 些 问题 。 









































。 给 定 x 的 值 ，add(x，0) 的 值 是 多 少 ? 
。 给 定 x、y-1 和 add(x,，y-1) 的 值 ，add(x,y) 的 值 是 多 少 ? 


第 一 个 问题 简单 : 一 个 数字 加 零 不 会 有 变化 ， 所 以 如 果 我 们 知道 x 的 值 ，add(x，0) 的 
值 将 是 相同 的 。 我 们 可 以 将 其 实现 为 一 个 叫 #add_zero_to_x 的 函数 ， 这 个 函数 只 返回 它 的 
参数 : 
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def add zero to x(x) 
基 
end 


第 二 个 问题 要 难 一 点 ， 但 是 回答 起 来 仍然 足够 简单 : 如果 已 经 有 了 add(x， 
我 们 只 要 将 其 递增 就 能 得 到 add(x，y) 的 值 。 这 意味 着 需要 一 个 能 增加 其 
值 的 函数 (#7ecurse 用 x、y-1 和 add(x，y-1) 作为 参数 来 调用 它 )。 我 们 管 


#increment easier result.: 


y-1) 的 值 ， 
第 三 个 参数 
这 个 函数 叫 


def increment easier result(x, easier y, easier result) 


increment (easier result) 
end 


把 这 些 放 到 一 起 我 们 就 得 到 了 #add 的 定义 ， 它 由 #recurse 和 提 ncrement 构造 出 来 : 
def add(x, y) 
recurse(:add zero to x, :increment easier result, x, y) 


end 


过 3 





第 6 章 的 思路 同样 适用 于 这 里 : 为 了 给 表达 式 取 方 便 的 名 字 ， 我 们 只 使 用 函 
心 ， 数 的 定义 ， 而 不 会 偷偷 地 递归 进 它们 ”。 如 果 想 要 写 一 个 递归 函数 ， 我 们 需 
4 要 使 用 #recurse。 

















来 确认 一 下 #add 在 做 它 该 做 的 寻 





Hl 
Ht 


>> add(two, three) 
总 党 -与 


看 起 来 很 好 。 我 们 可 以 用 同样 的 策略 来 实现 其 他 熟悉 的 例子 ， 比 如 multiply.…: 


def multiply x by zero(x) 
zero 
end 


def add x to easier result(x, easier y, easier result) 


add(x, easier result) 
end 


def multiply(x, y) 
recurse(:multiply x by zero, :add x to easier result, x, y) 
end 














注 4: 因为 减法 是 加 法 的 逆 运算 ， 所 以 (x+(y-1))+1=(x+(y+-1))+1。 因 为 加 法 的 结合 律 ， 所 以 (x+(y+- 
1))+1=(x+y)+(-1+1)。 而 因为 -1+1=0， 这 在 加 法 中 是 恒等式 ， 所 以 (x+y)+(-1+1)=X+y。 

注 5: 当然 #recurse 本 身 的 实现 从 根本 上 使 用 了 递归 方法 的 定义 ， 但 这 是 允许 的 ， 因 为 我 们 是 把 #recurse 
当成 系统 的 4 个 内 建 原 语 而 不 是 用 户 定 义 方法 来 处 理 的 。 
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还 有 #decTement : 


def easier x(easier x, easier result) 
easier x 
end 


def decrement(x) 
recurse(:zero, :easier x, x) 
end 


还 有 #subtract: 


def subtract zero from x(x) 
x 
end 


def decrement easier result(x, easier y, easier result) 
decrement(easier result) 
end 


def subtract(x, y) 
recurse(:subtract zero from x, :decrement easier result, x, y) 
end 


这 些 实现 运行 得 都 和 预期 一 样 : 


>> multiply(two, three) 
=> 6 
>> def six 
multiply(two, three) 
end 
=> Nil 
>> decrement(six) 


>> subtract(six, two) 
=> 4 
>> subtract(two, six) 
=> 0 


我 们 从 #zero、#increment 和 #recurse 组 合 出 来 的 程序 叫 原始 递归 函 


数 。 


所 有 的 原始 递归 函数 都 是 完全 的 : 不 管 输入 什么 ， 它 们 总 是 可 以 停止 并 返回 一 个 结果 。 这 是 





方法 





单独 一 步 的 所 有 操作 : 





















































因为 #fecurse 是 定义 递归 函数 的 唯一 合法 方式 ， 而 #recurse 是 总 能 停止 的 : 每 一 个 递归 调用 


都 会 使 其 最 后 一 个 参数 更 接近 零 ， 而 在 它 最 后 不 可 避免 地 成 为 零 时 ， 递 归 就 会 停止。 


zero、#increment 以 及 #recurse 足以 构造 许多 有 用 的 函数 ， 这 其 中 包括 图 灵机 执行 
图 灵机 纸 带 的 内 容 可 以 表示 成 一 个 大 数 ， 可 以 用 原始 递归 函数 





来 记 和 级 带头 当前 位 置 的 字符 、 往 纸 带 上 写 新 的 字符 以 及 左右 移动 纸 带 头 。 但 是 ， 因 为 有 些 





图 灵机 是 永远 循环 的 ， 所 以 我 们 没 法 使 用 原始 递归 函数 模拟 任意 
因此 原始 递归 函数 并 不 是 通用 的 。 
































台 图 灵机 的 完整 运行 ， 
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为 了 得 到 真正 的 通用 系统 ， 我 们 可 以 增加 第 四 个 基础 操作 一 一 #minimize: 


def minimize 
n = 0 
n= n+1 until yield(n).zero? 
n 

end 


方法 #minimize 接受 一 个 块 ， 并 不 断 地 使 用 一 个 数字 作为 参数 重复 调用 它 。 第 一 次 调用 时 ， 
参数 是 0， 然 后 是 1， 然 后 是 2， 之 后 一 直 用 越 来 越 大 的 值 做 参数 调用 块 ， 直 到 返回 零 为 目 。 








通过 在 #zero、#increment 和 #recurse 中 加 入 #minimize， 我 们 可 以 构造 更 多 的 函数 一 一 
所 有 的 部 分 递归 函数 一 一 包括 那些 永远 不 会 停止 的 函数 。 例 如 ，#minimize 让 我 们 很 容易 
实现 #divide: 

def divide(x, y) 


minimize { |n| subtract(increment(x), multiply(y, increment(n))) } 
end 





，。y*(n+1) 大 于 Xx 就 返回 零 。 如 果 试 图 用 13 除 以 4 (x=13，y=4)， 我 们 来 看 一 
下 随 着 n 的 增长 y*(n+1) 的 值 的 变化 : 





于 入 
、 把 表达 式 subtract(increment(x)，multiply(y，increment(n))) 设计 成 如 果 
~ 











n x y*(n+1) y*(n+1) 比 x 大 吗 ? 

0 3 4 否 

于 3 8 否 

2 3 让 否 

3 3 16 是 

4 3 20 是 

5 3 24 是 
第 一 个 满足 条 件 的 mn 值 是 3， 这 样 在 n 到 达 3 的 时 候 我 们 传 给 #mimimize 的 块 
会 返回 零 ， 所 以 得 到 了 divide(13,4) 的 结果 3。 








就 像 原始 递归 函数 一 样 ，#divide 收 到 有 意义 的 参数 时 总 会 返回 一 个 结果 : 





>> divide(six, two) 
> 了 
>> def ten 
increment(multiply(three, three)) 
end 
=> Nil 
>> ten 
=> 10 
>> divide(ten, three) 
二 




















但 是 因为 #minimize 能 永远 循环 ， 所 以 #divide 不 一 定 要 返回 一 个 结果 。 被 零 除 是 未 定义 的 : 


>> divide(six, zero) 
SystemStackError: stack level too deep 





因为 和 ininize 的 实现 是 迭代 的 ， 而 且 没有 直接 增加 调用 栈 ， 所 以 这 里 看 
一 到 酸 溢 出 有 点 奇怪 ， 但 是 溢出 发 生 在 #divide 对 递归 函数 ynultiply 的 调用 
期 间 。#multiply 的 递归 深度 由 它 的 第 二 个 参数 increment(n) 决定 ， 而 随 着 
iminimize 的 循环 试图 一 直 运行 下 去 ，n 的 值 变 得 很 大 ， 最 终 导致 了 楼 溢出 。 























有 了 #minimize， 通 过 重复 调用 原始 递归 函数 来 执行 模拟 中 的 一 步 ， 就 可 能 完全 模拟 一 台 
到 灵机 。 在 停机 之 前 模拟 一 直 运 行 一 一 如 果 永 远 不 停机 ， 那 模拟 就 会 永远 运行 。 


7.3” SKI 组 合子 演算 


就 像 lambda 演算 一 样 ，SKI 组 合子 演算 是 一 个 处 理 表 达 式 语法 的 规则 系统 。 尽 管 lambda 
演算 已 经 很 简单 了 ， 但 仍然 还 有 三 种 表达 式 : 变量 、 函 数 和 调用 。 我 们 在 6.2.2 市 中 看 到 
变量 使 规约 的 规则 有 点 复杂 。SKI 演算 更 简单 ， 它 只 有 两 种 表达 式 : 调用 和 字母 符号 ， 规 
则 也 更 简单 。 它 所 有 的 能 力 都 源 于 三 个 特别 的 符号 S、K 和 工 ( 叫 作 组 合子 )， 它 们 每 一 个 
都 有 自己 的 归 约 规则 : 


























。 SLa]j[bj[c] 规约 成 afcj[b[c]j， 其 中 a、b 和 c 可 以 是 任意 的 SKI 演算 表达 式 ， 
。 K[aj[b] 规约 成 ai 
。 I[a] 规约 成 a。 


例如 ， 下 面 是 规约 表达 式 I[S][K][S1LI[K]] 的 一 种 方式 : 
I[SJIKJLSJLILK]] 

















上 上 小 站 也 


注意 ， 这 里 没有 lambda 演算 那 种 变量 替换 ， 有 的 只 是 根据 规约 规则 对 符号 进行 的 记录 、 
复制 和 丢弃 。 


很 容易 实现 SKI 表达 式 的 抽象 语法 : 


class SKISymbol < Struct.new(:name) 
def to s 
name.to s 
end 


def inspect 
to s 
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end 
end 


Class SKICall < Struct.new(:left, :right) 
def to_s 
"#{left}[#{right}]" 
end 


def inspect 
to Ss 
end 
end 


class SKICombinator < SKISymbol 
end 


S, K, I = [:S, :K, :I].map { |name| SkICombinator.new(name) } 








y 3 
为 了 一 般 性 地 表示 调用 和 符号 ， 这 里 我 们 定义 了 类 SKICall 和 SKISymbol， 然 
心 。 后 创建 了 一 次 性 实例 S、K 和 工 来 表示 作为 组 合子 的 那些 特定 符号 。 
人 
我 们 没有 直接 让 S、K 和 工 成 为 SKISymbol 的 实例 ， 而 是 使 用 了 子 类 SKICominator 





的 实例 。 这 对 我 们 现在 没有 帮助 ， 但 是 它 会 简化 以 后 往 三 个 组 合子 对 象 中 增 
加 方法 的 工作 。 





这 些 类 和 对 象 能 被 用 来 构建 SKI 表达 式 的 抽象 语法 树 : 


>> x = SKISymbol.new(:x) 

=> x 

>> expression = SKICall.new(SKICall.new(S, K), SKICall.new(I, x)) 
=> S[K]J[I[Lx]] 


通过 实现 SKI 演算 的 规约 规则 并 在 表达 式 中 应 用 这 些 规则 可 以 为 SKI 演算 赋予 一 个 小 步 操 
作 语 义 。 首 先 ， 我 们 将 在 SKICombinator 实例 上 定义 一 个 叫 作 #call 的 方法 ; Ss、K 和 了 工 都 
有 它们 自己 #call 的 定义 ， 实 现 了 它们 的 归 约 规则 : 








# 规约 s[a]j[bj[c] 为 a[cj[b[c]] 
def S.call(a, b, c) 
SKICall.new(SKICall.new(a, c), SKICall.new(b, c)) 





好 了 ， 如 果 知 道 调用 组 合子 的 参数 是 什么 ， 我们 就 有 了 一 种 应 用 演算 规则 的 方式 …… 


>> 
=> 
>> 
=> 


y, z = SKISymbol.new(:y), SKISymbol.new(:z) 
[y, z] 

S.call(x, y, 7z) 

x[z][y[z]] 








A 但 要 对 一 个 真正 的 SKI 表达 式 使 用 #call 方法 ， 我 们 还 需要 从 中 提取 出 一 个 组 合子 和 
几 个 参数 。 因 为 一 个 表达 式 是 用 一 个 SKICall 对 象 组 成 的 二 又 树 表 示 的 ， 所 以 这 有 点 私 琐 : 


>> 
=> 














expression = SKICall.new(SKICall.new(SKICall.new(S, x), y), z) 
Slx][yj[lz] 


combinator = expression.left.left.1left 


S 

first argument = expression.left.left.right 
Xx 

second argument = expression.left.right 

y 


third argument = expression.right 
z 
combinator.call(first argument, second argument, third argument) 


x[zj[y[z]] 














为 了 让 这 个 结构 更 容易 处 理 ， 我 们 可 以 在 抽象 语法 树 上 定义 方法 #combinator 和 #arguments: 


cla 
d 


e 


d 


e 
end 


cla 
d 


e 


d 


e 
end 








ss SKISymbol 

ef combinator 
self 

nd 


ef arguments 


[] 
nd 


ss SKICall 

ef combinator 
left.combinator 
nd 


ef arguments 
left.arguments + [right] 
nd 


这 样 很 容易 发 现 要 调用 哪个 组 合子 以 及 传 给 它 什 么 参数 : 


>> 
> 
>> 
二 > 
>> 
=> 


expression 

Slx][yllz] 

combinator = expression.combinator 
S 

arguments = expression.arguments 
[x, y, z] 
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>> combinator.call(*arguments) 


=> x[z][y[z]] 


对 S[x][yj[z] 工作 得 很 好 ， 但 在 通常 情况 下 会 有 一 些 问题 。 首 先 #combinator 方法 只 是 
回 一 个 表达 式 最 左 侧 的 符号 ， 但 那个 符号 不 一 定 是 个 组 合子 : 


讽 区 





>> expression = SKICall.new(SKICall.new(x, y), z) 


-> x[y][z] 
>> combinator = expression.combinator 
=> Xx 

>> arguments = expression.arguments 
=> [y, 2] 


>> combinator.call(*arguments) 
NoMethodError: undefined method ‘call' for x:SKISymbol 





第 二 ， 就 算 最 左 侧 的 符号 是 一 个 组 合子 ， 它 也 不 一 定 被 用 合适 数目 的 参数 调用 : 


工 


>> expression = SKICall.new(SKICall.new(S, x), y) 


=> S[x][y] 
>> combinator = expression.combinator 
=>S 

>> arguments = expression.arguments 
-=> [x, y] 


>> combinator.call(*arguments) 
ArgumentError: wrong number of arguments (2 for 3) 


为 了 避免 这 两 个 问题 ， 我 们 将 定义 #callable? 方法 以 检测 是 否 适合 以 方法 #combinator 和 
#argument 的 结果 来 使 用 #call。 一 个 符号 永远 都 无 法 调用 ， 而 一 个 组 合子 只 有 在 参数 个 数 
正确 的 情况 下 才 可 以 调用 : 





class SKISymbol 
def callable?(*arguments) 
false 
end 
end 


def S.callable?(*arguments) 
arguments.1length == 
end 


def K.callable?(*arguments) 
arguments.length == 2 
end 


def I.callable?(*arguments) 
arguments.1length == 
end 

















、 数 量 ) ， 
总 

>> def add(x, y) 

X +y 
end 

=> nil 

>> add method = method(:add) 

=> #<Method: Object#add> 

>> add method.arity 

3% 2 


因此 ， 我 们 可 以 用 一 个 共享 #callable 实现 来 替换 Ss、K 和 I 各 自 的 实现 : 


class SKICombinator 
def callable?(*arguments) 
arguments.length == method(:call).arity 
end 
end 





现在 可 以 识别 归 约 规则 直接 适用 的 表达 式 了 : 


>> expression = SKICall.new(SKICall.new(x, y), z) 
x[y][z 
expression.combinator.callable?(*expression.arguments) 
false 
expression = SKICall.new(SKICall.new(S, x), y) 

=> 9[xj[Ly 
expression.combinator.callable?(*expression.arguments) 
false 
expression = SKICall.new(SKICall.new(SKICall.new(S, x), y), z) 

=> S[xj[y][z] 

>> expression.combinator.callable?(*expression.arguments) 

=> true 














最 后 ， 我 们 可 以 为 SKI 表达 式 实 现 熟悉 的 #7educible? 和 #reduce 方法 了 : 


class SKISymbol 
def reducible? 
false 
end 
end 


class SKICall 
def reducible? 
left.reducible? || right.reducible? || combinator.callable?(*arguments) 
end 


def reduce 
if left.reducible? 
SKICall.new(left.reduce, right) 
elsif right.reducible? 
SKICall.new(left, right.reduce) 
else 


顺便 说 一 下 ，Ruby 已 经 有 办 法 回答 一 个 方法 需要 多 少 个 参数 了 ( 它 的 参数 
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combinator.call(*arguments) 
end 
end 
end 


赚 六 


SKICall#reduce 递归 查找 我 们 已 经 知道 如 何 规约 的 子 表达 式 (例如 正在 以 三 
心 。 个 参数 进行 调用 的 S 组 合子 )， 然 后 使 用 #call 应 用 合适 的 规则 。 


PY 
0, 

















那 就 是 它 了 ! 我 们 现在 可 以 对 SKI 表达 式 不 断 规约 ， 直 到 不 能 规约 为 止 。 例 如 ， 下 面 使 用 
符号 x 和 y 调用 表达 式 S[KLS[T]]][K]， 它 交换 了 两 个 参数 的 顺序 : 





>> swap = SKICall.new(SKICall.new(S, SKICall.new(K, SKICall.new(S, 1))), K) 
=> SLK[S[I]]]LK] 
>> expression = SKICall.new(SKICall.new(swap, x), y) 
=> SLK[S[I]]]LK][x][y] 
>> While expression.reducible? 

puts expression 

expression = expression.reduce 

end; puts expression 


[xj[y] 


-一 一 一 
x 
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SKI 演算 用 三 个 简单 的 规则 就 产生 了 出 人 意料 的 复杂 行为 。 事 实 上 ， 复 杂 到 被 证 明 是 通用 
的 了 。 我 们 可 以 证 明 SKI 表 达 式 的 通用 性 ， 方 法 是 展示 如 何 把 任意 的 lambda 演算 表达 式 
转换 成 做 同样 事情 的 一 个 SKI 表达 式 ， 这 实际 上 也 是 使 用 SKI 演算 给 了 lambda 演算 一 个 


指称 语义 。 我 们 已 经 知道 lambda 演算 是 通用 的 ， 因 此 如 果 SKI 能 完全 模拟 它 ， 就 能 得 出 








SKI 演算 也 是 通用 的 结论 。 


转换 的 核心 是 一 个 叫 #as_a_function_of 的 方法 : 


class SKISymbol 
def as a function of(name) 
if self.name == name 
I 
else 
SKICall.new(K, self) 
end 
end 
end 


class SKICombinator 
def as a_ function of(name) 
SKICall.new(K, self) 
end 





end 


class SKICall 
def as a function of(name) 
left function = left.as a function of(name) 
right function = right.as a function of(name) 


SKICall.new(SKICall.new(S, left function), right function) 
end 
end 


方法 #as_a_function_of 的 工作 细节 并 不 重要 ， 但 粗略 上 讲 ， 它 把 一 个 SKI 表达 式 转 成 一 
个 新 的 表达 式 ， 这 个 表达 式 在 用 一 个 参数 调用 时 会 转 回 到 原来 的 表达 式 。 例 如 ， 表 达 式 
S[K][I] 被 转 成 S[SLKLS]]LKIK]]]LKLI]]: 








>> original = SKICall.new(SKICall.new(S, K), I) 
=> S[K][I] 

>> function = original.as a function of(:x) 

=> SLS[KLS]][KIK]]JIKLI]] 

>> function.reducible? 

=> false 





在 SLS[KLS]][K[K]]JIKLI]] 以 一 个 参数 比如 说 y 进行 调用 的 时 候 ， 它 将 会 规约 回 SIK][I]: 


>> expression = SKICall.new(function, y) 
=> S[SLKLS]][KLK]]]ILKEI]]IY] 
>> while expression.reducible? 

puts expression 

expression = expression.reduce 


>> expression == original 

=> true 
只 是 在 原始 表达 式 也 包含 有 那个 名 字 的 符号 时 参数 name 才 会 用 到 。 在 那 种 情况 下 ，#as_a_ 
function_of 会 产生 一 些 更 有 意思 的 东西 : 一 个 表达 式 ， 在 使 用 一 个 参数 进行 调用 的 时 候 ， 
它 会 规约 成 原始 表达 式 ， 其 中 那个 参数 会 替换 掉 符 号 : 





>> original = SKICall.new(SKICall.new(S, x), I) 
=> S[x][I] 
>> function = original.as a_function of(:x) 
=> S[SLKLS]][IJJIKLI]] 
>> expression = SKICall.new(function, y) 
=> S[SLKLS]][I]JIKLI]]LY] 
>> while expression.reducible? 
puts expression 





通用 性 无 处 不 在 | 207 


expression = expression.reduce 


KIS 


Eh 





>> expression == Original 
=> false 


一 个 lambda 演算 函数 在 被 调用 时 ， 函 数 体内 的 变量 会 被 蔡 换 掉 ， 上 面 是 对 这 种 方式 的 一 
个 明确 的 重新 实现 。 本 质 上 说 ，#as_a_function_of 给 了 我 们 使 用 SKI 表达 式 作为 函数 体 
的 方法 : 它 创建 了 一 个 新 的 表达 式 ， 这 个 表达 式 的 行为 就 像 带 有 一 个 特定 函数 体 和 一 个 参 
数 名 的 函数 ， 只 不 过 SKI 演算 没有 函数 语法 而 已 。 


SKI 演算 模拟 函数 的 能 力 把 lambda 演算 表达 式 与 SKI 表达 式 的 转换 变 得 直接 。lambda 
演算 变量 和 调用 成 为 了 SKI 演算 的 符号 和 调用 ， 而 每 一 个 lambda 演算 函数 体 用 #as_a_ 
function_of 转 成 了 一 个 SKI 演算 “函数 ”: 


class LCVariable 
def to ski 
SKISymbol.new(name) 
end 
end 


class LCCall 
def to ski 
SKICall.new(left.to ski, right.to ski) 
end 
end 


class LCFunction 
def to ski 
body.to ski.as a function of(parameter) 
end 
end 





让 我 们 通过 把 数字 “2”( 参 见 6.1.3 节 ) 的 lambda 演算 表示 转 成 SKI 演算 来 检查 一 下 这 个 
转换 : 

>> two = LambdaCalculusParser.new.parse('-> p { -> x { p[lp[x]] } }').to ast 

=> ->p{->x{plplxl] }} 

>> two.to ski 

=> SL[SL[K[S]J[STKIK]ILII]ILSISLKLSI] LSIKEKIILIIIIIKII]]] 
SKI 演算 表达 式 SIS[K[S]][SIKLK]J[I]]][SLSLKLS]JLSEKEKJ][IJ]JEKLI]]] 与 ->p{->x{p[pLx]]}} 
做 的 事情 一 样 吗 ? 应 该 是 在 其 第 二 个 参数 上 调用 它 的 第 一 个 参数 两 次 ， 因 此 我 们 可 以 尝试 
给 它 一些 参 数 来 看 看 它 实 际 是 怎么 做 的 ， 就 像 在 6.2.2 节 看 到 的 那样 ; 























>> inc, zero = SKISymbol.new(:inc), SKISymbol.new(:zero) 


.| 


inc, zero] 


>> expression = SKICall.new(SKICall.new(two.to ski, inc), zero) 
=> S[S[K[LS]J[SLKIK]ILII]]ISISIKES] ILSTIKEKII LI] IIIKLI]] [inc][zero] 


>> while expression.reducible? 


puts expr' 
expressio 


ession 
n = expression.reduce 


end; puts expression 


[a 





nt eds BE A A EY LA OY EA EA EA A A NN 


3 
K 
5 
5 
K 
K 
K 
K 
K 
K 
K 
K 
K 
K 
C 


in 
inc 
inc 
inc 





nc][zero] 


[SJ][S 
Sj][S 


di 


FT 
ed je 


K 

S 

I 
Kj][inc] 
[inc]]] 
inc]][lS 
inc]][lS 
incj]][K 
inc]][lS 
inc]][lS 
inc]][lS 
inc]][lS 
inc]][lS 
0 

€ 

















sel 








S[K[inc] 

K[inc][zer 
inc[I[zero 
inc[zeroj]] 








=> nil 





可 以 确定 了 ， 使 用 


是 我 们 所 想 要 的 。 
演算 可 以 完全 模拟 lambda 演算 ， 从 而 它 一 定 是 通用 的 。 


a 





含有 


可 见 



























































































































































SKI 演算 有 三 个 组 合子 ， 但 工 组 合子 实际 上 是 元 余 的 。 有 许多 表达 式 只 
3 和 K， 它 们 做 的 事情 和 I 一样， 例如 SIKJ[K]: 


>> identity = SKICall.new(SKICall.new(S, K), K) 
=> S[KJIK] 
>> expression = SKICall.new(identity, x) 
=> S[K]LK][x] 
>> while expression.reducible? 

puts expression 

expression = expression.reduce 

end; puts expression 

SIK][K]LxX] 
KLx]J[K[x]] 
x 
=> Nil 





SIK][K] 的 行为 与 1 一 样 ， 这 对 任何 形式 为 SIK][ 任意 ] 的 SKI 表达 式 





都 成 立 。I 组 合子 是 我 们 非 必需 的 语法 糖 。 对 于 通用 性 来 说 ， 两 个 组 合子 5 
和 就 是 够 了 。 


K]][I]JI]ESISIK[S] [SIKEKI][II]IIKII]]][inc][zero] 
[I]][inc][SISIK[S]][SIKIK] II]]][K[I]] [inc]][zero] 
K]][I][inc]][S[S[K[S]][S[K[K]][I]]]IKII]][inc]][zero] 
nc]][S[S[K[S]][S[K[K]][I K[I]][inc]][zero] 

nc]]][SISIK[S]J[SIK[K] J[I]]]IKII]] [inc]][zero] 

S[K[S]][S[K[K [K[I]][inc]][zero] 

[SI]J[S[K[K]][I]]]IIKII] [inc]][zero] 
SJ]][SIKIK]][I]][inc][K[I][inc]]][zero 

inc][S[K[K]][I][inc]][K inc]]][zero 
K[K]][I][inc]][K[Il[inc]]][zero 
K] [inc inc K[I][inc]]][zero] 
I[inc]]][K[Il][linc zero 

inc]][K[Il[inc]]][zero] 

inc |]][Il]lzero 

K[inc]][I][zero] 
I][zero 
ol][Ilzero]]] 

]] 

中 inc 和 zero 的 符号 调用 转换 过 的 表达 式 求 值 为 inc[inc[zero]]， 这 正 
同样 的 转换 对 任何 其 他 lambda 表达 式 也 能 成 功 执行 ， 因 此 SKI 组 合子 
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7.4” 约 塔 (lota) 


希腊 字母 约 塔 (1) 是 可 以 添加 到 SKI 演 算 里 的 另 一 个 组 合子 。 下 面 是 它 的 规约 规则 : 
Lau ] 可 以 规约 成 oa [SlLK]。 


我 们 的 SKI 演算 实现 让 加 入 一 个 新 的 组 合子 变 得 很 容易 : 




















IOTA = SKICombinator.new('1') 


# 规约 1[a] 为 alS][K] 

def IOTA.call(a) 
SKICall.new(SKICall.new(a, S), K) 

end 


def IOTA.callable?(*arguments) 
arguments.length == 1 
end 


Chris Barker 提交 了 一 种 叫 作 Iota (http://semarch.linguistics.fas.nyu.edu/barker/Iota/) 的 语 
吾 ， 它 的 程序 只 使 用 1 组 合子 。 尽管 目 只 有 一 个 组 合子 ， Jota 仍然 是 一 种 通 用 语言 ， 因 为 任 
何 SKI 演算 表达 式 都 可 以 转 成 它 ， 而 我 们 已 经 看 到 SKI 演算 是 通用 的 。 











可 以 通过 应 用 这 些 替 换 规则 把 SKI 表达 式 转 成 Iota: 


。 用 1[1[1[1[1]]]] 赫 换 5， 
。 用 1[1[1[1]]] 替换 K; 
。 用 1[1] 替换 I。 


很 容易 实现 这 个 转换 : 


class SKISymbol 
def to iota 
self 
end 
end 


class SKICall 
def to iota 
SKICall.new(left.to iota, right.to iota) 
end 
end 


def S.to iota 
SKICall.new(IOTA, SKICall.new(IOTA, SKICall.new(IOTA, SKICall.new(IOTA, IOTA)))) 
end 


def K.to iota 
SKICall.new(IOTA, SKICall.new(IOTA, SKICall.new(IOTA, IOTA))) 
end 





def I.to iota 
SKICall.new(IOTA, IOTA) 
end 


S、K 和 I 组 合子 的 Iota 版 与 原始 表达 式 是 否 等 价 一 点 都 不 明显 ， 因 此 我 们 可 以 通过 规约 
SKI 演算 内 部 的 每 一 个 组 合子 并 观察 它们 的 行为 来 进行 研究 。 下 面 是 在 我 们 把 5 转换 成 
Iota 然后 对 其 进行 规约 的 过 程 : 























>> expression = S.to iota 
=> ii]] 
>> while expression.reducible? 
puts expression 
expression = expression.reduce 
end; puts expression 


1]]] 


ee 


1 
1 
1 
S 








A 





EA A Tei di 
天 Wo 
天 一 一 天 天 天 二 





FR 


[i 
jt 





大 大 WW- 


i 
天 
让 


Im 天 一 一 一 一 一 一 一 一 一 一 一 


> nil 





是 的 ，1[1[1[1[1]]]] 实际 上 与 等 价 。 这 同样 也 适用 于 K: 


>> expression = K.to iota 
=> 1L1[1[L1]]] 
>> while expression.reducible? 
puts expression 
expression = expression.reduce 
end; puts expression 











1 LU]l] 
"LiLts]Lg]] 
tLi[SLS]LKJLK]]] 
tw[i[SLKJLKIKI]]] 
ts[kj[KLK [sj [1] 
L[K[sj[KLKLS] IO] 
LIK[sj [IO] 
[SLK]] 

S[K][s][K] 
K[K][s[g]] 

K 

=> nil 








但 对 于 工 则 不 行 。! 规约 规则 只 会 产生 含有 Ss 和 KK 组 合子 的 表达 式 ， 因 此 不 可 能 以 字面 量 I 
结束 : 
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>> expression = I.to iota 
> 和 白 闻 | 
>> while expression.reducible? 
puts expression 
expression = expression.reduce 
end; puts expression 





因此 SI[K][KLK]] 在 语法 上 与 I 不 等 价 ， 但 它 是 $5 和 Kk 组 合子 表达 式 与 1 表达 式 做 同样 事情 
的 另 一 个 例子 : 


>> identity = SKICall.new(SKICall.new(S, K), SKICall.new(K, K)) 
=> SLK][KLK]] 
>> expression = SKICall.new(identity, x) 
=> SLIK]LKLK]][x] 
>> While expression.reducible? 

puts expression 

expression = expression.reduce 

end; puts expression 


SLKJLKLK]] [x] 


=> Nil 


所 以 到 Iota 的 转换 虽然 没有 完全 保留 所 有 三 个 SKI 组 合子 的 语法 ， 但 确实 保留 了 它们 的 个 
体 行为 。 我 们 可 以 通过 把 熟悉 的 lambda 演算 表达 式 用 它 的 SKI 演算 表示 转 成 Iota 来 测试 
整体 的 效果 ， 然 后 对 其 求 值 以 检查 它 的 行为 : 


>> two 


>> two.to_Sski 
=> SIS 
>> two 
i 


i.to iota, inc), zero) 
]]]L LE 
| JI[i[i[i[i [1]]] 


inc][zero] 




















-一 一 
ee 
dy 
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Dae 















































Sn 
>> expression 
=> inc[inc[zero]] 

















inc[inc[zero]] 是 我 们 所 期 望 的 结果 ， 因 此 Iota 表达 式 [Ei[i[i]]]][i[i[i[i[1]]]] 
[EU ti]] 








[1 
[il 


i[il 
i[it 


村 一 


1 





[Ett] 
[Efi[fi[ij]j][i[1]]]] 实际 是 一 个 对 ->p{->xfp[p[x]]}} 进行 无 变量 、 


无 国 数 并 且 只 有 一 个 组 合子 的 有 效 转 换 。 而 因为 我 们 可 以 对 任何 lambda 演算 表达 式 进行 
这 种 转换 ， 所 以 Iota 是 另 一 种 通用 语言 。 


7.5 ”标签 系统 


标签 系统 (tag system) 是 一 个 类 似 简化 版 图 灵机 的 计算 模型 : 标签 系统 不 是 在 一 条 纸 带 上 
来 回 移动 纸 带 头 ， 而 是 反复 在 一 个 字符 串 的 末尾 增加 新 的 字符 并 在 开头 处 移 除 字符 。 在 某 





方 下 





























ij， 标 签 系统 的 字符 串 像 是 图 灵机 的 纸 带 ， 但 标签 系统 被 限定 在 只 能 在 字符 串 的 两 头 操 




















作 ， 而 且 它 只 能 朝 着 末尾 “移动 。 


标签 系统 的 描述 包括 两 部 分 : 首先 ， 一 个 规则 集合 ， 其 中 每 一 条 规则 定义 当 特 定 的 字符 
出 现在 字符 串 的 开头 时 ， 要 给 这 个 字符 串 添 加 的 一 些 字符 (例如 “字符 串 的 开头 是 字符 a 
时 ， 添 加 字符 bcd”) ， 其次， 一 个 叫 作 删除 数 的 数字 ， 它 定义 了 按照 一 个 规则 执行 之 后 有 
多 少 字符 要 从 字符 串 的 开头 删除 。 











下 




















看 是 一 个 标签 系统 的 例子 ， 


字符 串 以 a 开头 时 ， 添 加 字符 bc; 
字符 串 以 b 开头 时 ， 添 加 字符 caad; 
字符 串 以 < 开头 时 ， 添 加 字符 ccd; 
按照 上 面 的 任何 规则 执行 之 后 ， 从 字符 串 的 开头 删除 三 个 字符 ， 换 名 话说 ， 删 除数 是 3。 








我 们 可 以 通过 反复 遵照 规则 并 删除 字符 直到 字符 串 的 首 字 符 没 有 可 用 的 规则 ， 或 者 直到 字 
符 串 的 长 度 小 于 删除 数 “， 以 此 来 执行 一 个 标签 系统 的 计算 。 我 们 用 初始 字符 串 “aaaaaa' 
来 运行 一 下 示例 标签 系统 : 


当前 字符 串 可 用 规则 





aaaaaa 


aaabc 


bcb 


字符 串 以 a 开头 时 ， 添 加 字符 bc 
字符 串 以 a 开头 时 ， 添 加 字符 pc 
字符 串 以 bp 开头 时 ,添加 字符 caad 

ccaad 字符 串 以 < 开头 时 ， 添 加 字符 ccd 

adccd 字符 串 以 a 开头 时 ,添加 字符 bc 
cdbc 字符 串 以 < 开头 时 ， 添 加 字符 ccd 
cccd 字符 串 以 c 开头 时 ， 添 加 字符 ccd 

dccd 一 





























: 第 二 个 条 件 可 以 防止 我 们 删除 比 字符 串 所 含有 的 字符 数 还 多 的 字符 。 
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标签 系统 只 能 直接 在 字符 串 上 操作 ， 但 我 们 也 可 以 让 它们 对 其 他 类 型 的 值 (例如 数字 ) 执 
行 复杂 的 操作 ， 只 要 用 合适 的 方式 把 那些 值 编码 成 字符 串 就 行 。 对 数字 编码 的 一 种 可 能 

式 是 : 把 数字 mn 表示 成 字符 串 aa 后 跟 重复 n 次 的 字符 串 bb。 例 如 ， 把 数字 3 表示 成 字符 
串 aabbbbbb。 




















这 个 表示 的 某 些 方面 可 能 看 起 来 是 多 余 的 〈 可 以 只 是 把 3 表示 成 aaa)， 但 很 
， 快 你 就 会 发 现 ， 使 用 成 对 的 字符 ， 并 在 字符 串 的 开头 进行 明确 的 标记 很 
必 ” 有 用 。 











选 定 了 数字 的 编码 模式 ， 就 可 以 设计 标签 系统 操作 数字 了 。 下 面 是 一 个 对 输入 数 翻 倍 的 
系统 : 


。 字符 串 以 a 开头 时 ， 添 加 字符 aa; 
。 字符 串 以 b 开头 时 ， 添 加 字符 bbbb， 
。 在 执行 完 一 个 规则 之 后 ， 从 字符 串 的 开头 删 掉 两 个 字符 (删除 数 为 2)。 


观察 一 下 起 始 字符 串 是 aapbbb 时 这 个 标签 系统 是 如 何 表现 的 ， 这 个 字符 串 表 示 2: 


aabbbb 











bbbbaa 

bbaabbbb 

aabbbbbbbb ( 表示 数字 4) 
bbbbbbbbaa 

bbbbbbaabbbb 

bbbbaabbbbbbbb 
bbaabbbbbbbbbbbb 
aabbbbbbbbbbbbbbbb ( 数字 8) 
bbbbbbbbbbbbbbbbaa 
bbbbbbbbbbbbbbaabbbb 


:lllLlLILILILIL 





很 明显 翻 售 了 ， 但 这 个 标签 系统 却 永远 运行 下 去 了 (把 由 当前 字符 串 表 示 的 数 翻 倍 ， 然 后 
再 翻 倍 ， 然 后 再 翻 倍 ) ， 这 真 不 是 我 们 想 要 的 。 为 了 设计 一 个 只 对 一 个 数字 翻 倍 一 次 然后 
停机 的 系统 ， 我 们 需要 使 用 不 同 的 字符 对 结果 进行 编码 ， 以 保证 不 再 触发 新 一 轮 的 翻 倍 。 
我 们 可 以 通过 放松 编码 模式 ， 允 许字 符 c 和 dd 替换 a 和 b， 然 后 修改 规则 ， 在 表示 翻 倍 之 
后 的 数 时 使 用 cc 和 dddd 而 不 是 aa 和 bbbb。 






































这 样 改变 之 后 ， 计 算 看 起 来 像 是 这 样 : 
aabbbb — bbbbcc 
一 bbccdddd 
一 ccdddddddd (数字 4， 用 c 和 dd 而 不 是 a 和 b 进行 编码 ) 


修改 后 的 系统 在 到 达 ccdddddddd 时 会 停止 ， 因 为 没有 针对 c 开头 字符 串 的 规则 。 






































在 这 种 情况 下 ， 我 们 只 是 依赖 字符 c 适时 停止 计算 ， 因 此 完全 可 以 在 结果 中 
重用 b 而 不 是 用 d 来 替换 它 ， 但 使 用 超出 必要 的 字符 没有 什么 害处 。 














使 用 不 同 的 字符 集合 来 对 输入 和 输出 值 进行 编码 会 更 清晰 一 些 。 就 像 我 们 很 
快 将 要 看 到 的 那样 ， 这 还 能 更 容易 地 把 几 个 小 的 标签 系统 组 合成 一 个 大 的 系 
统 ， 可 以 通过 把 一 个 系统 的 输出 编码 与 另 一 个 系统 的 输入 编码 匹配 做 到 。 








为 了 在 Ruby 中 模拟 标签 系统 ， 我 们 需要 一 个 单 规则 的 实现 (TagRule)， 一 个 规则 集合 的 
实现 (TagRulebook)， 以 及 标签 系统 自身 的 实现 (TagSystem) : 





class TagRule < Struct.new(:first character, :append characters) 
def applies to?(string) 
string.chars.first == first_ character 
end 


def follow(string) 
string + append characters 
end 
end 


class TagRulebook < Struct.new(:deletion number, :rules) 
def next string(string) 
rule for(string).follow(string).slice(deletion number..-1) 
end 


def rule for(string) 
rules.detect { |r| r.applies to?(string) } 
end 
end 


class TagSystem < Struct.new(:current string, :rulebook) 
def step 
self.current string = rulebook.next string(current string) 
end 
end 


这 个 实现 允许 我 们 单 步 执行 标签 系统 的 计算 ， 一 次 只 执行 一 个 规则 。 让 我 们 试 试 之 前 的 对 
数字 翻 倍 的 例子 ， 这 次 对 数字 3 (aabbbbbb) 翻 倍 : 


>> rulebook = TagRulebook.new(2, [TagRule.new('a', 'aa'), TagRule.new('b', 'bbbb')]) 
=> #<struct TagRulebook ...> 
>> System = TagSystem.new('aabbbbbb' , rulebook) 
=> #<struct TagSystem ...> 
>> 4.times do 

puts system.current string 

system.step 

end; puts system.current string 

aabbbbbb 
bbbbbbaa 
bbbbaabbbb 
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bbaabbbbbbbb 
aabbbbbbbbbbbb 
=% hI 


因为 这 个 标签 系统 会 永远 运行 ， 所 以 我 们 只 能 在 结果 出 现 之 前 预先 知道 执行 多 少 步 (这 种 
情况 下 是 4 步 )， 但 如 果 我 们 使 用 把 结果 用 < 和 d 编码 的 修改 版 本 ， 就 可 以 让 它 自动 停 下 


来 。 


增加 代码 来 支持 它 : 


class TagRulebook 
def applies to?(string) 
lrule for(string).nil? 8&& string.length >= deletion number 
end 
end 


class TagSystem 
def run 
while rulebook.applies to?(current string) 
puts current string 
step 
end 


puts current string 
end 
end 


现在 可 以 只 对 标签 系统 的 停机 版 本 调用 TagSystem#run， 并 让 其 在 合适 时 机 自然 停止 : 


这 个 


执行 


>> rulebook = TagRulebook.new(2, [TagRule.new('a', 'cc'), TagRule.new('b', 'dddd')]) 
=> #<struct TagRulebook ...> 

>> System = TagSystem.new('aabbbbbb' , rulebook) 
=> #<struct TagSystem ...> 

>> system.run 

aabbbbbb 

bbbbbbcc 

bbbbccdddd 

bbccdddddddd 

ccdddddddddddd 

=> Nil 


| 由 








实现 允许 我 们 探索 标签 系统 能 做 的 其 他 事情 。 使 用 我 们 的 编码 模式 ， 很 容易 设计 系统 
其 他 的 数字 操作 ， 就 像 下 面 这 个 对 一 个 数字 减 半 的 系统 : 














>> rulebook = TagRulebook.new(2, [TagRule.new('a', 'cc'), TagRule.new('b', 'd')]) 
=> #<struct TagRulebook ...> 

>> System = TagSystem.new( "aabbbbbbbbbbbb' ，Tulebook) 

=> #<struct TagSystem ...> 

>> system.run 

aabbbbbbbbbbbb 

bbbbbbbbbbbbcc 

bbbbbbbbbbccd 

bbbbbbbbccdd 

bbbbbbccddd 





| 全 A 


第 7 章 


bbbbccdddd 
bbccddddd 
ccdddddd 
=> nil 


还 有 这 个 递增 一 个 数字 的 系统 : 


>> rulebook = TagRulebook.new(2, [TagRule.new('a', 'ccdd'), TagRule.new('b', 'dd')]) 


=> #<struct TagRulebook ...> 

>> System = TagSystem.new('aabbbb', rulebook) 
=> #<struct TagSystem ...> 

>> system.run 

aabbbb 

bbbbccdd 

bbccdddd 

ccdddddd 

=> nj 


我 们 可 以 把 两 个 标签 系统 联结 一 起 ， 只 要 第 一 个 系统 的 输出 编码 与 第 二 个 

















e 和 上 了 对 它们 的 输出 进行 编码 ， 以 此 把 翻 倍 和 递增 规则 组 合 到 一 起 : 


>> rulebook = TagRulebook.new(2, [ 
TagRule.new('a', 'cc'), TagRule.new('b', 'dddd'), # double 
TagRule.new('c', 'eeff'), TagRule.new('d', 'ff') # increment 

]) 

=> #<struct TagRulebook ...> 

>> System = TagSystem.new('aabbbb', rulebook) 

=> #<struct TagSystem ...> 

>> system.run 

aabbbb ( 数字 2) 

bbbbcc 

bbccdddd 

ccdddddddd (数字 4) @ 

ddddddddeeff 

ddddddeeffff 

ddddeeffffff 

ddeeffffffff 

eeffffffffff (数字 5) @ 

=> Nil 


@ 翻 倍 规则 把 2 转 成 4， 用 字符 c 和 d 编码 。 
@ 递增 规则 把 4 转 成 5， 这 次 使 用 e 和 上 f 编码 。 


除了 把 数字 转 成 其 他 数字 之 外 ， 标 签 系统 还 可 以 检查 它们 的 数学 特性 。 下 
是 奇数 还 是 偶数 的 标签 系统 : 


>> rulebook = TagRulebook.new(2, [ 
TagRule.new('a', 'cc'), TagRule.new('b', 'd'), 
TagRule.new('c', 'e0'), TagRule.new('d', ''), 
TagRule.new('e', 'e') 
]) 


=> #<struct TagRulebook ...> 





系统 的 输入 编码 
匹配 即 可 。 下 面 是 一 个 简单 的 系统 ， 它 使 用 字符 c 和 d 对 递增 规则 的 输入 进行 编码 ， 寺 





用 


Tp 














外 是 测试 一 个 数 
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如 果 输 入 代表 一 个 偶数 ， 这 个 系统 会 停止 在 单字 符 e (代表 “偶数 ”) : 


>> System = TagSystem.new('aabbbbbbbb', rulebook) 
=> #<struct TagSystem ...> 

>> system.run 

aabbbbbbbb (the number 4) 

bbbbbbbbcc 

bbbbbbccd 

bbbbccdd 


@a 和 b 把 输入 减 半 ，ccdddd 代表 数字 2。 

@c 规则 删 掉 前 导 的 cc 对 ， 并 添加 字符 eo， 它 们 中 间 的 一 个 会 形成 最 后 的 结果 。 
四 空 的 4 规则 会 耗 尽 所 有 的 前 导 dd 对 ， 只 留 下 eo。 

@e 规则 只 会 用 e 替换 so， 然 后 系统 停机 。 


如 果 输 入 的 数 为 奇数 ， 那 么 结果 就 是 字符 串 o (代表 “奇数 ") : 


>> System = TagSystem.new('aabbbbbbbbbb', rulebook) 
=> #<struct TagSystem ...> 
>> system.run 

aabbbbbbbbbb ( 数字 5) 
bbbbbbbbbbcc 

bbbbbbbbccd 

bbbbbbccdd 

bbbbccddd 

bbccdddd 

ccddddd @ 

dddddeo 


@ 数字 像 以 前 一 样 减 半 ， 但 因为 这 次 是 奇数 ， 所 以 结果 是 一 个 奇数 个 d 组 成 的 字符 串 。 我 
们 对 数字 的 编码 模式 只 使 用 成 对 的 字符 ， 因 此 ccddddd 不 代表 任何 数 ， 但 因为 它 含 有 
“两 个 半 ” 成 对 的 字符 qd， 可 以 不 正式 地 把 它 看 成 是 数字 2.5。 

@ 所 有 前 导 的 dd 对 都 被 删 掉 了 ， 在 最 终 的 eo 之 前 留 下 了 一 个 d。 

全 残留 的 4 被 删 掉 了 ， 并 带 走 了 e， 只 留 下 o， 然 后 系统 停机 。 














硅 妆 


Ey 加 为 了 让 这 个 标签 系统 工作 ， 拥 有 大 于 1 的 删除 数 至 关 重 要 。 因 为 每 个 第 二 字 
4 











AS 。 符 都 会 触发 一 个 规则 ， 我 们 可 以 通过 在 特定 的 触发 位 置 安排 特定 的 字符 出 现 
全 (或 者 不 出 现 ) 来 影响 系统 的 行为 。 这 种 让 字符 在 删除 行为 中 同步 或 者 不 同 
步 出 现 的 技术 是 设计 强大 标签 系统 的 关键 。 

















这 些 数字 操作 技术 可 以 用 来 模拟 一 台 图 灵机 。 在 像 标签 系统 这 么 简单 的 东西 之 上 构建 模拟 
的 图 灵机 涉及 大 量 细节 ， 但 其 中 一 种 工作 方式 像 是 下 面 这样 。 




















(1) 作为 可 能 最 简单 的 例子 ， 让 一 台 图 灵机 的 纸 带 只 使 用 两 个 字符 ， 我 们 将 称 它们 为 0 和 
1， 其 中 0 扮演 空白 字符 的 角色 。 

(2) 把 图 灵机 的 纸 带 分 成 两 部 分 : 左 半 部 分 含有 纸 带 头 下 的 字符 和 所 有 它 左边 的 字符 ， 右 
半 部 分 含有 纸 带 头 右边 的 所 有 字符 。 

(3) 把 纸 带 的 左 半 部 分 作为 一 个 二 进 制 数 : 如 果 最 初 的 纸 带 类 似 0001101(0)0011000， 那 么 
左 半 部 分 就 是 二 进 制 数 11010， 这 是 十 进 制 数 26。 

(4) 把 纸 带 的 右 半 部 分 作为 一 个 反 写 的 二 进 制 数 : 示例 纸 带 的 右 半 部 分 是 二 进 制 数 1100， 
即 十 进 制 数 12。 

(5) 把 这 两 个 数 编码 成 一 个 适合 由 标签 系统 使 用 的 字符 串 。 对 于 示例 纸 带 ， 我 们 可 以 使 用 
aa 后 跟 26 份 bb， 然 后 cc 后 跟 12 份 dd。 

(6) 使 用 简单 的 翻 倍 、 减 半 、 递 增 、 递 减 ， 以 及 奇偶 检查 模拟 从 纸 带 上 读 、 向 纸 带 写 以 及 
移动 纸 带 头 。 例 如 ， 我 们 通过 对 左 半 部 分 数字 翻 倍 ， 对 右 半 部 分 数字 减 半 "来 在 示例 纸 
带 上 向 右 移 动 纸 带 头 : 翻 倍 26 得 到 52， 二 进 制 就 是 110100，12 的 一 半 是 6， 二进制 
是 110。 因 此 新 的 纸 带 看 起 来 是 011010(0)011000。 从 纸 带 上 读 取 意味 着 检查 表示 纸 带 
左 半 部 分 的 数字 是 奇数 还 是 偶数 ， 而 向 纸 带 上 写 一 个 1 或 者 0 意思 是 对 那个 数 递 增 或 者 
递减 。 

(7) 使 用 选择 的 字符 来 对 左右 纸 带 数 进 行 编码 ， 以 此 来 表示 所 模拟 图 灵机 的 当前 状态 : 或 
许 机 器 处 于 状态 1， 我 们 使 用 3、b、c 和 dd 来 对 纸 带 进行 编码 ， 但 它 转 移 到 状态 2 时 ， 
使 用 e、f、g 和 h 来 编码 ， 以 此 类 推 。 

(8) 把 每 一 个 图 灵机 规则 转 成 一 个 标签 系统 ， 它 会 用 合适 的 方式 对 当前 字符 串 进行 重 写 。 读 
取 一 个 0， 写 入 一 个 1， 向 右 移动 纸 带 头 并 进入 状态 2 的 规则 变 成 的 标签 系统 ， 会 检查 
左 侧 纸 带 的 数 是 偶数 ， 对 其 递增 ， 翻 倍 左边 纸 带 的 数 ， 同 时 减 半 右 边 纸 带 的 数 ， 然 后 
产生 一 个 使 用 状态 2 的 字符 编码 的 字符 串 。 

(9) 把 这 些 独立 的 标签 系统 组 合 起 来 ， 就 是 一 个 可 以 模拟 图 灵机 每 一 条 规则 的 大 系统 。 



































a 
对 于 标签 系统 如 何 模拟 图 灵机 工作 的 完整 说 明 ， 请 看 Matthew Cook 在 http:/ 
4 。 Www.complex-systems.com/pdV15-1-1.pdf 中 2.1 节 所 做 的 简洁 解释 。 


人 
Cook 的 模拟 比 这 里 描述 的 更 复杂 。 它 使 用 当前 字符 串 的 “对 齐 ” 来 表示 所 
模拟 纸 带头 下 面 的 字符 ， 而 不 是 把 它 作 为 纸 带 的 一 部 分 ， 而 且 它 很 容易 扩 
展 ， 通 过 增加 标签 系统 的 删除 数 来 以 任意 数目 的 字符 模拟 一 台 图 灵机 。 




















标签 系统 可 以 模拟 任意 图 灵机 的 事实 ， 意 味 着 它 也 是 通用 的 。 











注 7: 对 一 个 数 翻 倍 在 二 进 制 表 示 上 就 是 所 有 的 数字 左 移 一 位 ， 而 减 半 就 是 把 所 有 的 数字 右 移 一 位 。 
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7 一 /or 
7.6 ”循环 标签 系统 
循环 标签 系统 (cyclic tag system) 是 施加 了 一 些 额 外 限制 的 更 简单 的 标签 系统 。 


。 循环 标签 系统 的 字符 串 只 能 包含 两 个 字符 : 0 和 1。 


。 循环 标签 系统 的 规则 


只 会 在 当 


A 人 \ 羡 





前 字符 串 以 1 开始 而 不 是 0 开始 的 时 候 


。 循环 标签 系统 的 删除 数 总 是 1。 


这 些 约束 本 身 对 于 支持 任何 有 用 的 计算 来 说 都 过 于 苛刻 了 ， 因 此 作为 补偿 循环 标签 系统 有 
一 个 额外 的 特性 : 循环 标签 系统 的 规则 手册 中 的 第 一 条 规则 是 执行 开始 时 的 当前 规则 ， 并 
且 在 计算 的 每 一 步 之 后 ， 规 则 手册 中 的 下 一 个 规则 就 成 为 了 当前 规则 ， 在 到 达 规 则 手册 结 
尾 的 时 候 又 会 回 到 第 一 个 规则 。 


这 种 系统 被 称 为 “循环 的 "， 是 因为 当前 规则 不 断 地 在 规则 手册 中 循环 。 一 个 当前 规则 ， 




















遍历 规则 手册 查找 可 用 规则 的 


有 可 用 的 规则 。 


作为 一 个 例子 ， 我 们 看 一 下 拥有 三 个 规则 的 循环 标签 系统 ， 三 





0010 和 10。 下 面 是 以 字符 串 11 开始 时 的 情形 : 


当前 字符 串 
11 
11 
10010 
001010 
01010 
1010 
01010 
1010 
0100010 
100010 
000101 
00101 
0101 
101 
010010 
10010 
00101 





注 8: 循环 标签 系统 的 规则 没有 必要 说 “字符 


当前 
添加 
添加 
添加 
添加 
添加 
添加 
添加 
添加 
添加 
添加 
添加 
添加 
添加 
添加 
添加 
添加 
添加 








i 有著 


ES 


由 


慌 慌 | 旦 


Cs 


人 


EE 


过 








人 
i 





00 


只 需要 “添加 字符 011” 就 是 够 了 。 








可 


克 训 友和 到 双双 洪 克 条 克 和 双双 计 澡 漆 





以 1 


以 应 用 规则 吗 


F 始 时 ， 添 加 字符 011”， 











会 应 用 。 


再 结合 上 每 条 规则 都 只 会 应 用 到 1 开头 的 字符 串 这 一 约束 ， 避 免 了 在 每 一 步 执行 中 不 得 不 
F 销 。 如 果 首 字符 是 1， 那么 就 应 用 当前 规则 ， 否 则 ， 就 没 


个 规则 分 别 添加 字符 1， 





大 











为 第 一 部 分 


已 经 假定 了 一 一 
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尽管 这 个 系统 极其 简单 ， 我 们 也 能 看 到 一 点 点 复杂 的 行为 : 接 下 来 要 发 生 什么 并 不 明显 。 
稍微 思考 一 下 ， 可 以 证 明 这 个 系统 将 会 永远 运行 下 去 而 不 是 缩减 成 一 个 空 字 符 串 ， 这 是 因 
为 每 个 规则 都 添加 一 个 1， 因此 只 要 最 初 的 字符 串 含有 一 个 1， 它 就 不 会 完全 结束 。 但 是 
前 字符 串 会 断断续续 地 持续 变 长 ， 还 是 会 进入 扩张 和 收缩 的 反复 模式 呢 ? 只 看 规则 没 法 
回答 这 个 问题 ， 需 要 一 直 运 行 这 个 系统 以 查 明 会 发 生 什么 。 


二 




















| 








我 们 已 经 有 了 常见 标签 系统 的 一 个 Ruby 实现 ， 因 此 模拟 循环 标签 系统 不 需要 太 多 的 额外 
工作 。 我 们 通过 简单 的 子 类 化 TagRule 实现 CyclicTagRule 并 把 '1' 硬 编码 为 它 的 first_ 


character: 





class CyclicTagRule < TagRule 
FIRST CHARACTER = "14" 


def initialize(append characters) 
super(FIRST CHARACTER, append characters) 
end 


def inspect 
"#<CyclicTagRule #{append characters.inspect}>" 


end 


end 


#initialize 是 一 个 构造 方法 ， 在 一 个 类 的 实例 被 创建 时 会 自动 调用 。 
CyclicTagRule#initialize 从 超 类 TagRule 调用 构造 函数 ， 以 此 来 设置 first_ 
3 character 和 append_characte 属性 。 














循环 标签 系统 的 规则 工作 方式 有 些许 的 不 同 ， 因 此 我 们 将 从 头 构建 一 个 CylicTagRulebook 
类 ， 提 供 对 #applies_to? 和 #next_string 的 新 实现 : 


class CyclicTagRulebook < Struct.new(:rules) 
DELETION NUMBER = 1 


def initialize(rules) 
super(rules.cycle) 
end 


def applies to?(string) 
string.length >= DELETION NUMBER 
end 


def next string(string) 




















follow next rule(string).slice(DELETION NUMBER..-1) 
end 
注 9: 循环 标签 系统 与 正常 的 标签 系统 不 同 ， 它 在 没有 规则 可 用 的 时 候 仍 然 会 一 直 运 行 ， 不 然 的 话 它 就 什么 




















也 做 不 了 。 让 循环 标签 系统 停止 运行 的 唯一 方式 就 是 使 它 的 当前 字符 串 成 为 空 。 例 如 在 初始 字符 串 完 
全 由 字符 0 组 成 的 时 候 ， 总 会 出 现 空 字符 串 。 
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def follow next rule(string) 
rule = rules.next 


if rule.applies to?(string) 
rule.follow(string) 
else 
string 
end 
end 
end 


不 像 TagRulebook， 即 使 当前 规则 不 能 应 用 ，CyclicTagRulebook 也 总 是 应 用 到 非 空 字符 
串 上 。 








Array#cycle 创建 一 个 Enumerator (参见 6.1.11 节 “ 原 始 Ruby 流 ” 部 分 )， 
。 它 会 永远 地 循环 访问 一 个 数组 的 元 素 : 


>> numbers = [1, 2, 3].cycle 

=> #<Enumerator: [1, 2, 3]:cycle> 
>> numbers.next 

=> 1 

>> numbers.next 

=> 2 

>> numbers.next 

<> 3 

>> numbers.next 


>> [:a, :b, :c, :dj.cycle.take(10 

=> 3 by Ed 363. bs TE Tq; :i | 
这 人 恰好 是 我 们 对 循环 标签 系统 当前 规则 所 要 求 的 行为 ， 因 此 
CyclicTagRulebook#initialize 把 这 些 循环 中 的 一 个 赋 给 规则 属性 ， 然 后 每 
次 对 #follow_next_rule 的 调用 都 使 用 rules.next 得 到 循环 中 的 下 一 条 规则 。 








现在 我 们 可 以 创建 由 CyclicTagRules 组 成 的 CyclicTagRulebook， 然 后 把 它 放 到 一 个 
TagSystem 里 观察 其 工作 情况 : 








>> rulebook = CyclicTagRulebook.new([ 
CyclicTagRule.new('1'), CyclicTagRule.new('0010'), CyclicTagRule.new('10') 
]) 
=> #<struct CyclicTagRulebook ...> 
>> System = TagSystem.new('11', rulebook) 
=> #<struct TagSystem ...> 
>> 16.times do 
puts system.current string 
system. step 
end; puts system.current string 
11 
11 
10010 
001010 





01010 
1010 
01010 
1010 
0100010 
100010 
000101 
00101 
0101 
101 
010010 
10010 
00101 
=>》 Nl 


这 与 我 们 手工 单 步 执行 时 候 看 到 的 行为 相同 。 继 续 吧 .: 





>> 20.times do 
puts system.current string 
system. step 
end; puts system.current string 
00101 
0101 
01 








01 
=> Nil 





以 字符 串 11 开始 时 ， 这 个 系统 确实 进入 到 重复 的 行为 中 : 在 一 段 不 稳定 阶段 过 后 ， 会 出 
现 9 个 连续 的 字符 串 (101、010010、10010、00101……) 并 会 一 直 这 么 重复 下 去 。 当 然 ， 
如 果 我 们 改变 了 初始 字符 串 或 者 任意 规则 ， 那 长 期 的 行为 都 会 变 得 不 同 。 


循环 标签 系统 极其 受 限 (它们 的 规则 不 灵活 ， 只 有 两 个 字符 ， 删 除数 也 是 最 低 值 )， 但 令 
人 吃惊 的 是 ， 仍 然 可 以 使 用 它们 模拟 任何 标签 系统 。 


由 一 个 循环 标签 系统 对 一 个 正常 标签 系统 的 模拟 大 概 像 下 本 














描述 的 这 样 工作 。 
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(1) 决定 标签 系统 的 字母 表 : 它 使 用 的 字符 集合 。 

(2) 设计 编码 模式 ， 把 每 一 个 字符 与 一 个 适合 用 在 循环 标签 系统 里 的 唯一 字符 串 关联 起 来 
(也 就 是 只 包含 0 和 1)。 

(3) 把 每 一 个 原始 系统 的 规则 转换 成 一 个 循环 标签 系统 的 规则 ， 方 法 是 对 它 添加 的 字符 进 
行 编码 。 

(4) 用 空 规则 填补 循环 标签 系统 的 规则 手册 ， 模 拟 原 始 标签 系统 的 删除 数 。 

(5) 对 原始 标签 系统 的 输入 字符 串 进 行 编码 ， 并 使 用 它 作 为 循环 标签 系统 的 输入 。 


押 就 来 具体 实现 上 述 思 路 。 首 先 ， 需 要 能 得 到 一 个 标签 系统 所 使 用 的 字符 : 














一 











class TagRule 
def alphabet 
([first character] + append characters.chars.entries).uniq 
end 
end 


class TagRulebook 
def alphabet 
rules.flat map(&:alphabet).uniq 
end 
end 


class TagSystem 
def alphabet 
(rulebook.alphabet + current string.chars.entries).uniq.sort 
end 
end 


我 们 可 以 在 7.5 节 数 字 递 增 的 标签 系统 上 测试 这 个 功能 。Tagsystem#alphabet 表明 这 个 系 
统 使 用 字符 a、b、c 和 d: 

>> rulebook = TagRulebook.new(2, [TagRule.new('a', 'ccdd'), TagRule.new('b', 'dd')]) 

=> #<struct TagRulebook ...> 

>> System = TagSystem.new('aabbbb', rulebook) 

=> #<struct TagSystem ...> 

>> system.alphabet 

a> ay by ers de] 
下 一 步 ， 我 们 需要 把 每 个 字符 编码 成 循环 标签 系统 能 使 用 的 字符 串 。 能 让 模拟 工作 的 具体 
编码 模式 是 : 每 个 字符 都 表示 成 一 个 0 组 成 的 字符 串 ， 其 长 度 与 字母 表 相 同 ， 只 是 在 某 个 
位 置 上 有 一 个 1 反映 字符 在 字母 表 中 的 位 置 。” 


标签 系统 字母 表 里 有 4 个 字符 ， 所 以 每 个 字符 都 编码 成 4 个 字符 组 成 的 字符 串 ， 在 不 同 的 
位 置 放 上 1: 











注 10: 0 和 1 的 结果 序列 并 不 是 二 进 制 数 ， 只 是 含有 一 个 1 标识 特定 位 置 的 0 组 成 的 字符 串 。 
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标签 系统 字符 在 字母 表 中 的 位 置 编码 表示 





a 0 1000 
b 1 0100 
2 0010 
3 0001 


为 了 实现 这 个 编码 模式 ， 我 们 将 引入 CyclicTagEncoder， 它 可 以 由 一 个 特定 的 字母 表 构 造 








出 来 ， 然 后 对 字母 表 中 的 字母 进行 编码 : 





class CyclicTagEncoder < Struct.new(:alphabet) 
def encode string(string) 
string.chars.map { |character| encode character(character) }.join 
end 


def encode character(character) 
character position = alphabet.index(character) 
(0...alphabet.length).map { |n| n == character position ? '1 
end 
end 


: '0' }.join 


class TagSystem 
def encoder 
CyclicTagEncoder.new(alphabet) 
end 
end 





现在 可 以 使 用 标签 系统 的 CyclicTagEncoder 对 由 a、b、c 和 d 组 成 的 任意 字符 串 


码 了 : 


>> encoder = System.encodeT 

=> #<struct CyclicTagEncoder alphabet=["a", "b", "c", "d"]> 
>> encoder.encode character('c') 

=> "0010" 

>> encoder.encode string('cab') 

=> "001010000100" 








使 用 这 个 编码 器 ， 我 们 可 以 把 每 个 标签 系统 规则 转换 成 对 应 的 循环 标签 系统 规则 。 我 们 只 是 对 








TagRule 的 append _ characters 进行 编码 ， 然 后 使 用 结果 字符 串 构建 一 个 CyclicTagRule: 


class TagRule 
def to cyclic(encoder) 
CyclicTagRule.new(encoder.encode string(append characters)) 
end 
end 


在 一 个 TagRule 上 试 一 下 : 





>> rule = system.rulebook.rules.first 
=> #<struct TagRule first character="a", append characters="ccdd"> 
>> rule.to cyclic(encoder) 


=> #<CyclicTagRule "0010001000010001"> 
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好 ，append characters 2 经 被 转换 了 ， 但 现在 我 们 已 经 失去 了 关于 哪个 first_character 应 该 触 
发 规则 的 信息 管 它 由 哪个 TagRule 转换 而 来 ， 每 一 个 first_character 都 会 被 字符 1 
触发 。 


此 时 ， 该 信息 由 循环 标签 系统 里 规则 的 顺序 传达 : 第 一 个 规则 针对 字母 表 中 的 第 一 个 字 
符 ， 第 二 个 规则 针对 第 二 个 字符 ， 以 此 类 推 。 1 系统 中 没有 对 应 规则 的 字符 都 会 
在 循环 标签 系统 中 得 到 一 个 空 规则 。 











我 们 可 以 实现 一 个 TagRulebook#cyclic_rules 方法 返回 按照 正确 顺序 排列 的 转换 后 的 规则 : 


class TagRulebook 
def cyclic rules(encoder) 
encoder.alphabet.map { |character| cyclic rule for(character, encoder) } 
end 


def cyclic rule for(character, encoder) 
rule = rule for(character) 


if rule.nil? 
CyclicTagRule.new('') 
else 
rule.to cyclic(encoder) 
end 
end 
end 





可 





面 是 #cyclic_rules 为 我 们 的 标签 系统 产生 的 规则 : 








>> system.rulebook.cyclic rules(encoder) 
=> |[ 
#<CyclicTagRule “0010001000010001 >， 
#<CyclicTagRule "00010001">, 
#<CyclicTagRule "">, 
#<CyclicTagRule ""> 
] 





转换 后 的 a 和 b 规则 首先 出 现 ， 后 边 在 < 和 d 的 位 置 上 跟着 两 个 空白 规则 。 


这 个 结果 与 模拟 工作 所 依托 的 字符 编码 模式 相 吻合 。 例 如 ， 如 果 模 拟 的 标签 系统 的 输入 字 
符 串 是 单独 的 一 个 字符 b， 在 循环 标签 系统 的 输入 字符 串 中 将 出 现 0100。 以 下 是 系统 在 运 
行 这 个 输入 时 的 情况 

















当前 字符 串 当前 规则 规则 可 以 应 用 吗 
0100 添加 字符 0010001000010001 (a 规则 ) 否 
100 添加 字符 00010001 (b 规则 ) 是 
0000010001 什么 都 不 添加 (c 规则 ) 否 
否 


000010001 什么 都 不 添加 (d 规则 ) 








在 计算 的 第 一 步 ， 当 前 规则 是 转换 后 的 a 规则 ， 并 且 因 为 当前 字符 串 以 0 开始 ， 所 以 当前 
规则 不 会 应 用 。 但 在 第 二 步 ， 随 着 前 导 的 0 从 当前 字符 串 中 被 删除 ，b 规则 成 为 当前 规则 ， 
同时 暴露 出 一 个 前 导 的 1， 它 将 触发 规则 应 用 。 下 两 个 字符 都 是 0， 因 此 c 和 dd 规则 都 不 会 
用 到 。 











可 见 ， 通 过 小 心安 排 输入 字符 串 中 字符 1 的 出 现时 间 ， 以 便 与 循环 标签 系统 规则 出 现 的 周 
期 一 致 ， 我 们 可 以 在 合适 的 时 间 触 发 合适 的 规则 ， 完 美 地 模拟 常见 标签 系统 规则 的 字符 匹 
配 行为 。 

最 后 ， 我 们 需要 模拟 原始 标签 系统 的 删除 数 。 这 可 以 通过 向 循环 标签 系统 的 规则 手册 中 
插入 额外 的 空 规 则 来 完成 ， 以 便 在 一 个 字符 被 成 功 处 理 后 删除 合适 数量 的 字符 。 如 果 原 
始 的 标签 系统 在 其 字母 表 中 有 mn 个 字符 ， 那 么 原始 系统 字符 串 的 每 一 个 字符 都 表示 为 循 
环 标签 系统 字符 串 中 的 mn 个 字符 ， 因 此 对 于 每 个 增加 的 想 要 删除 的 模拟 字符 ， 需 要 mn 个 
空 规则 : 


























class TagRulebook 
def cyclic padding rules(encoder) 
Array.new(encoder.alphabet.length, CyclicTagRule.new('')) * (deletion number - 1) 
end 
end 





标签 系统 的 字母 表 里 有 4 个 字符 ， 删 除数 是 2， 因 此 除了 已 经 被 转换 后 规则 删 掉 的 字符 之 
外 ， 我 们 还 需要 4 个 空 规则 以 删 掉 一 个 模拟 的 字符 : 


>> system.rulebook.cyclic _ padding rules(encoder) 
| 
#<CyclicTagRule "">, 
#<CyclicTagRule "">, 
#<CyclicTagRule "">, 
#<CyclicTagRule ""> 
] 


现在 我 们 可 以 把 所 有 东西 都 放 到 一 起 来 为 TagRulebook 实现 一 个 完整 的 钠 o_cyclic 方法 ， 
然后 在 TagSystem#to_cyclic 方法 中 使 用 它 ， 把 规则 手册 和 当前 字符 串 都 转换 成 一 个 完整 
的 循环 标签 系统 : 


class TagRulebook 
def to cyclic(encoder) 
CyclicTagRulebook.new(cyclic rules(encoder) + cyclic padding rules(encoder)) 
end 
end 


class TagSystem 
def to cyclic 
TagSystem.new(encoder.encode string(current string), rulebook.to cyclic(encoder)) 
end 
end 
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7 
I 








是 我 们 转换 数字 递增 标签 系统 并 运行 时 所 发 生 的 : 





>> cyclic system = system.to cyclic 

=> #<struct TagSystem ...> 

>> cyclic system.run 

100010000100010001000100 (aabbbb) @ 
000100001000100010001000010001000010001 
00100001000100010001000010001000010001 
0100001000100010001000010001000010001 
100001000100010001000010001000010001 (abbbbccdd) 四 
00001000100010001000010001000010001 
0001000100010001000010001000010001 
001000100010001000010001000010001 
01000100010001000010001000010001 (bbbbccdd) © 
1000100010001000010001000010001 @ 
00010001000100001000100001000100010001 
0010001000100001000100001000100010001 
010001000100001000100001000100010001 (bbbccdddd) 
10001000100001000100001000100010001 
0001000100001000100001000100010001 
001000100001000100001000100010001 
01000100001000100001000100010001 (bbccdddd) 
1000100001000100001000100010001 @ 
00010000100010000100010001000100010001 
0010000100010000100010001000100010001 
010000100010000100010001000100010001 (bccdddddqd) 
10000100010000100010001000100010001 
0000100010000100010001000100010001 
000100010000100010001000100010001 
00100010000100010001000100010001 (ccdddddd) @ 
0100010000100010001000100010001 
100010000100010001000100010001 
00010000100010001000100010001 @ 


001 


sh 


@ 标签 系统 的 编码 后 版 本 的 a 规则 在 这 里 。 

如 模拟 字符 串 的 第 一 个 完整 字符 已 经 被 处 理 了 ， 因 此 下 面 的 4 步 使 用 空 规则 删除 接 下 来 所 
模拟 的 字符 。 

四 经 过 循环 标签 系统 的 8 步 之 后 ， 所 模拟 的 标签 系统 完成 了 完整 一 步 。 

@ 编码 后 的 b 规则 在 这 里 触发 了 …… 

@ pp 这 里 又 一 次 。 

@ 循环 标签 系统 计算 24 步 了 ， 而 我 们 到 达 了 所 模拟 标签 系统 最 终 字 符 串 的 表示 : 


C 





cdddddd, 


@ 所 模拟 的 标签 系统 对 于 c 或 者 d 开头 的 字符 串 没 有 规则 ， 因 此 循环 标签 系统 的 当前 字符 


TH 








持续 变 得 越 来 越 短 …… 
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@ … 直 到 变 成 空 字符 串 ， 然 后 系统 停机 。 


这 个 技术 可 以 用 来 模拟 任何 标签 系统 ， 包 括 本 身 已 经 模拟 了 一 台 图 灵机 的 标签 系统 。 这 意 
味 着 循环 标签 系统 也 是 通用 的 。 


7.7 ” Conway 的 生命 游戏 


1970 年 ，John Conway 发 明了 一 个 叫 作 生命 游戏 (Game of Life) 的 通用 系统 。“ 游 戏 ” 要 在 
一 个 无 限 多 的 二 维 网 格 里 进行 ， 网 格 的 每 个 小 方 格 可 以 是 生 或 是 死 。 一 个 小 方 格 有 8 个 邻 
居 : 它 上 面 的 三 个 单元 ， 紧 挨 着 它 的 左右 两 个 单元 ， 以 及 它 下 面 的 三 个 单元 。 












































生命 游戏 像 有 限 状 态 机 那样 分 一 系列 步骤 进行 。 在 每 一 步 ， 根 据 由 这 个 单元 自身 的 当前 状 
态 和 它 邻 居 的 状态 所 触发 的 规则 ， 每 个 单元 都 可 能 从 生 转 变 为 死 ， 或 者 相反 。 规 则 很 简 
单 : 如 果 一 个 活着 的 单元 有 少 于 两 个 (人 口 稀 少 ) 或 者 多 于 三 个 (人口 过 剩 ) 活着 的 邻 
居 ， 它 就 会 死 掉 ， 如 果 一 个 死 的 单元 恰好 有 三 个 活着 的 邻居 它 就 能 复活 (繁殖 )。 














下 面 是 生命 游戏 规则 如 何 通 过 一 步 的 进程 来 影响 一 个 单元 状态 的 6 个 例子 “， 生 的 单元 用 
黑色 表示 ， 死 的 单元 用 白色 表示 : 





PP 





CPT 





像 这 样 的 一 个 系统 ， 称 为 细胞 自动 机 ， 包 括 一 个 单元 组 成 的 数组 和 在 每 一 步 
。 更 新 一 个 单元 状态 的 规则 集合 。 


























就 像 本 章 我 们 已 经 看 到 的 其 他 系统 一 样 ， 尽 管 规 则 简单 ， 但 生命 游戏 展示 了 出 平 意料 的 复 
杂 性 。 特 定 模 式 的 生 的 单元 会 出 现 有 趣 的 行为 ， 其 中 最 若 名 的 就 是 滑翔 机 (glider) ， 这 是 
一 个 5 个 生 单元 的 组 合 ， 每 经 过 4 步 它 们 就 会 沿 对 角 线 移动 一 个 方 格 : 











注 11: 512 种 可 能 : 包括 9 个 单元 ， 并 且 其 中 每 个 单元 可 以 是 两 种 状态 中 的 一 个 ， 因 此 有 2 x2x2x2x 
2 x 2 x 2 x 2 x 2=512 种 不 同 的 可 能 。 
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Ee i EE 


目前 已 经 发 现 了 很 多 有 意义 的 模式 ， 包 括 用 不 同方 式 移动 的 网 格 形状 (spaceship)、 产 生 一 
连 串 的 其 他 形状 (gun)， 或 者 甚至 产生 它们 自身 的 完整 复制 品 (replicator)。 














1982 年 ，Conway 除了 展示 如 何 靠 以 创造 性 的 方式 碰撞 “请 翔 机 ”来 设计 逻辑 上 的 与 门 
(AND)、 或 门 (OR) 和 非 门 (NOT) 以 执行 数字 计算 之 外 ， 还 展示 了 如 何 使 用 一 连 串 的 
“请 翔 机 ”来 表示 二 进 制 数 据 。 这 些 结 构 说 明理 论 上 可 以 用 生命 游戏 模拟 一 个 数字 计算 机 ， 
但 Conway 没有 设计 出 来 一 台 可 工作 的 机 器 


到 这 里 ,构造 一 台 任 意 的 大 型 有 限 (同时 非常 慢 ! ) 的 计算 机 只 是 一 个 工程 问题 了 。 
我 们 的 工程 师 已 经 给 出 te [……] 我 们 已 经 模拟 
的 这 种 计算 机 从 学 术 上 被 称 为 通用 机 器 ， 因 为 它 可 以 编程 执行 任何 想 要 的 计算 





John Conway,《 稳 操 胜 券 》(Winning Ways for Your Mathematical Plays) 


2002 年 ，Paul Chapman 实现 了 一 个 特种 通用 计算 机 (http://www.igblan.free-online.co.uk/igblan/ 
ca/)。 而 2010 年 ，Paul Rendell 构造 出 了 一 台 通 用 图 灵机 (http://rendell-attic.org/gol/utm/)。 


下 面 是 一 小 部 分 Rendell 设计 的 特写 : 
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7.8 rule 110 


rule 110 是 另 一 个 细胞 自动 机 ， 由 Stephen Wolfram 在 1983 年 提出 。 与 Conway 生命 游戏 
里 每 个 单元 要 么 是 生 的 要 么 是 死 的 类 似 ，rule 110 操作 的 单元 按 一 维 排列 而 不 是 二 维 网 格 
形式 。 这 意味 着 每 个 单元 只 有 两 个 邻居 而 不 是 围绕 着 每 个 生命 游戏 单元 的 8 个 邻居 。 


在 rule 110 自动 机 的 每 一 步 ， 一 个 单元 的 下 一 个 状态 是 由 它 自身 的 状态 和 它 两 个 邻居 的 状 
态 决 定 的 。 与 生命 游戏 里 规则 都 是 通用 的 而 且 可 以 应 用 到 生 和 死 单元 不 同 ，rule 110 自动 
机 对 每 一 种 可 能 都 有 一 个 单独 的 规则 : 


“一 
{ 1 ! 1! J} J} | 



































如 果 我 们 读 取 应 用 这 8 个 规则 之 后 的 值 ， 把 一 个 死 单 元 当成 0， 把 一 个 生 单 
心 。 元 当成 1， 就 可 以 得 到 二 进 制 数 01101110。 再 转换 可 以 产生 十 进 制 数 110， 
~ 这 就 是 这 个 细胞 自动 机 名 字 的 由 来 。 






























































rule 110 比 生命 游戏 简单 得 多 ， 但 它 同 样 有 复杂 行为 的 能 力 。 下 面 是 一 台 rule 110 自动 机 从 
一 个 简单 生 单元 开始 的 前 几 步 : 
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们 就 可 以 看 到 有 趣 的 模式 : 
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7.9 Wolfram 的 2,3 图 灵机 


我 们 要 介绍 的 最 后 一 个 简单 通用 系统 甚至 比 rule 110 还 简单 :， Wolfram 的 2,3 图 只 机 。 它 
的 名 字源 于 其 两 个 状态 和 三 个 字符 (a、b 和 空格 ) ， 这 意味 着 它 只 有 6 个 规则 : 














a/b;L 
b/a;l b/a;R 


注 羽 


人 克 这 人 台 图 灵机 与 众 不 同 ， 因 为 它 没有 接受 状态 ， 因 此 它 从 来 不 会 停机 ， 但 这 主 
6 

















要 是 一 个 技术 细节 。 我 们 仍然 可 以 通过 观察 特定 的 行为 来 得 导 到 不 停机 机 器 的 
结果 (例如 ， 纸 带 上 一 个 特定 模式 字符 的 出 现 )， 并 据 以 认为 当前 纸 带 含有 
有 用 的 输出 。 









































Wolfram 的 2,3 图 灵机 看 起 来 没有 强大 到 能 支持 通用 计算 。2007 年 ，Wolfram Research 宣布 
将 给 予 能 证 明 它 是 通用 的 人 25 000 美元 的 奖励 。 那 年 下 半年 ，Alex Smith 通过 成 功 的 证 明 
拿 到 了 这 个 奖 。 就 像 对 rule 110 一 样 ， 这 个 证 明 靠 的 是 展示 出 这 种 机 器 可 以 模拟 任何 循环 
标签 系统 。 这 个 证 明 还 是 非常 详细 的 ， 在 http://www.wolframscience.com/prizes/tm23/ 可 以 
看 到 全 文 。 
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不 可 能 的 程序 


世界 上 最 幸运 的 事 ， 是 人 脑 无 法 把 自身 的 内 容 全 部 关联 起 来 。 


一 一 霍华德 菲利普 ， 洛 夫 克 拉夫 特 





本 书 中 ， 我 们 已 经 探索 了 不 同 的 计算 机 和 编程 语言 模型 ， 其 中 包括 儿 种 抽象 机 器 。 这 些 机 
器 中 有 一 些 更 强大 ， 特 别 是 有 两 种 机 器 有 相当 明显 的 限制 : 有 限 自动 机 无 法 解决 涉及 无 限 
制 计数 的 同 题 ， 例 如 判定 一 个 括号 组 成 的 字符 串 是 否 平衡 ， 下 推 自 动机 无 法 处 理 任何 信息 








需要 在 多 处 重用 的 问题 ， 例 如 判定 一 个 字符 串 是 否 含有 同样 数目 的 字符 a、pb 和 c。 





但 我 们 已 经 看 到 的 最 先进 的 机 器 一 一 





图 灵机 ， 似 乎 拥有 我 们 需要 的 一 切 : 拥有 无 限制 的 存 





储 ， 这 个 存储 能 以 任何 顺序 、 在 任意 的 循环 中 、 在 任意 的 条 件 语 句 以 及 子 例 程 中 访问 。 第 
6 章 中 的 极 小 编程 语言 lambda 演算 ， 被 证 明 也 出 奇 得 强大 : 稍 加 精心 设计 ， 它 就 允许 我 们 
把 简单 的 值 和 复杂 的 数据 结构 都 表示 成 纯 代 码 ， 还 能 实现 操纵 这 些 表示 的 运算 。 而 在 第 7 
章 ， 我 们 看 到 了 许多 简单 的 系统 ， 就 像 lambda 演算 一 样 ， 它 们 也 与 图 灵机 有 着 同样 的 通 


用 能 


我 们 还 能 将 系统 不 断 增强 的 过 程 推进 多 少 ? 或 许 并 不 是 不 确定 的 : 我 们 通过 增加 特性 让 图 


























灵机 做 更 强大 的 尝试 ， 但 没有 取得 任何 进展 ， 这 表明 计算 能 力 可 能 存在 着 一 种 硬性 的 限 





制 。 那 么 计算 机 和 编程 语言 的 基本 能 力 是 什么 呢 ? 有 什么 它们 做 不 到 的 事情 吗 ? 存在 不 可 


能 的 程序 吗 ? 
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8.1 基本 事实 


这 都 是 相当 深奥 的 问题 ， 因 此 在 试图 理解 它们 之 前 ， 我 们 先 回顾 一 下 计算 领域 的 一 些 基 本 
事实 。 其 中 一 些 事实 很 明显 ， 而 有 一 些 没 那 么 明显 ， 但 它们 都 是 思考 计算 机 的 能 力 和 限制 
的 前 提 条 件 。 


8.1.1 能 执行 算法 的 通用 系统 


通常 说 来 ， 使 用 像 图 灵机 、lambda 演算 和 部 分 递归 函数 这 样 的 通用 系统 我 们 能 干什么 呢 ? 
如 果 我 们 能 恰当 理解 这 些 系统 的 能 力 ， 那 就 可 以 考察 一 下 它们 的 限制 。 


计算 机 的 实际 目的 就 是 执行 算法 。 算 法 是 一 个 指令 列表 ， 指 令 描述 把 一 个 输入 值 转 成 一 个 
输出 值 的 过 程 ， 但 必须 满足 某 些 条 件 。 














































































































。 有 限 
指令 的 数量 是 有 限 的 。 

。 简单 
指令 要 足够 简单 ， 一 个 人 用 一 支 笔 和 一 张 纸 就 能 计算 出 结果 。 


。 终止 


对 于 任何 输入 ， 一 个 遵守 指令 执行 的 人 都 会 在 有 限 步骤 内 终止 。 





. 正确 
对 于 任何 输入 ， 一 个 遵守 指令 的 人 都 将 得 到 正确 的 答案 。 





例如 ， 一 个 已 知 最 古老 的 算法 是 欧 几 里 得 算法 ， 这 要 追 滴 到 公元 前 300 年 。 它 以 两 个 正 整 
数 为 参数 ， 返 回 能 恰好 整除 它们 的 最 大 整数 一 一 也 就 是 它们 的 最 大 公约 数 。 下 面 是 它 的 
指令 。 


(1) 给 定 两 个 数 x 和 y。 

(2) 判断 x 和 yy 哪个 数 更 大 。 

(3) 从 大 的 数 中 减 去 小 的 数 。( 如 果 x 更 大 ， 就 从 x 中 减 去 y， 并 把 这 个 新 值 赋 给 xXx， 反之 
亦 然 。) 

(4) 重复 步骤 (2) 和 步骤 (3)， 直 到 x 和 y 相等 为 止 。 

(5) x 和 y 相等 的 时 候 ， 它 们 的 值 就 是 原来 两 个 值 的 最 大 公约 数 。 

我 们 很 愿意 承认 这 是 一 个 算法 ， 因 为 它 看 起 来 能 满足 基本 的 条 件 。 它 只 包含 有 限 的 几 条 指 

令 ， 而 且 都 足够 简单 ， 对 整个 问题 没有 特别 理解 的 人 也 可 以 使 用 铅笔 和 纸 算出 结果 。 再 稍 

微 思 考 一 下 ， 我 们 可 以 看 出 对 于 任意 的 输入 它 都 一 定 能 在 有 限 步 又 内 结束 : 每 重复 一 次 步 







































































又 3， 两 个 数 中 的 一 个 就 会 变 小 一 些 ， 因 此 它们 最 终 一 定 会 到 达 同 样 的 值 并 让 算法 结束 。 
这 个 算法 是 否 总 是 能 给 出 正确 的 答案 不 是 那么 明显 ， 但 一 些 代数 学 的 基础 就 足以 证 明 所 得 
到 的 结果 必定 是 原始 数字 的 最 大 公约 数 了 。 


所 以 欧 几 里 得 算法 确实 是 一 个 算法 。 但 像 任何 算法 一 样 ， 它 只 是 表示 为 人 类 可 读 语言 和 符 
号 的 思想 的 集合 。 如 果 想 要 用 它 做 一 些 有 用 的 事情 (或 许 我 们 想 要 探索 它 的 数学 性 质 ， 或 
者 设计 一 台 自 动 执 行 它 的 机 器 )， 我 们 就 需要 把 算法 转换 成 一 个 更 严格 的 、 歧 义 更 少 的 形 
式 ， 这 才 适 合 数 学 分 析 和 机 械 执行 。 


我 们 已 经 有 了 一 个 计算 模型 用 来 做 这 件 事 情 : 可 以 尝试 把 欧 几 里 得 算法 写成 一 台 图 灵机 的 
规则 手册 ， 或 者 一 个 lambda 演算 的 表达 式 ， 或 者 一 个 部 分 递归 函数 定义 ， 但 所 有 这 些 都 涉 
及 内 部 的 处 理 以 及 其 他 一 些 枯燥 的 细节 。 我 们 暂时 先 把 它 转 换 成 没有 限制 的 Ruby: 


def euclid(x, y) 



































until x == y 
if x>y 
X=X-y 
else 
y 
end 
end 
x 
end 


本 质 上 这 个 #euclid 方 法 与 欧 几 里 得 算法 的 自然 语言 描述 版 本 有 着 同样 的 指令 ， 但 这 次 它 
们 是 用 含义 严格 的 定义 方式 (根据 Ruby 的 操作 语义 ) 写 的 ， 因 此 可 以 由 一 台 机 器 解释 : 








>> euclid(18, 12) 

=> 6 

>> euclid(867, 5309) 
=> 1 





在 这 个 特定 的 情况 下 ， 很 容易 把 一 个 非 形 式 化 的 、 人 类 可 读 的 算法 描述 转换 成 对 一 台 机 器 
来 说 没有 歧义 的 指令 。 拥 有 机 器 可 读 形 式 的 欧 几 里 得 算法 非常 方便 ， 现 在 我 们 无 需 手工 区 
动 就 可 以 快速 可 靠 地 反复 执行 这 个 算法 了 。 





地 六 
很 明显 我 们 还 可 以 用 与 6.1.7 节 类 似 的 技术 把 这 个 算法 用 lambda 演算 来 实 
全 4 、 现 ,或 者 从 7.2 节 的 操作 来 构建 一 个 部 分 递归 函数 ， 或 者 像 5.1.2 节 那 样 通过 
二 ， 简 单 算术 运算 实现 一 个 图 灵机 的 规则 集合 。 

















注 1: x 和 y 最 小 值 可 以 是 1。 
注 2: Ruby 已 经 内 建 了 欧 几 里 得 算法 #Integer#gcd， 但 这 不 是 重点 。 
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这 提出 了 一 个 重要 的 问题 : 任何 算法 都 能 转换 成 适合 一 台 机 器 执行 的 指令 吗 ? 表面 上 看 ， 
这 个 问题 似乎 不 值 一 提 一 一 如 何 把 欧 儿 里 得 算法 转换 成 一 个 程序 相当 明显 。 而 作为 程序 
员 ， 我 们 有 天 然 的 倾向 会 把 两 者 看 成 可 互 换 的 一 一 但 在 一 个 计算 系统 中 ， 一 个 算法 抽象 
的 、 直 觉 的 思想 与 具体 的 、 逻 辑 上 的 实现 是 存在 实质 差别 的 。 是 否 存 在 一 个 算法 ， 它 大 、 
复杂 而 且 不 同 寻 常 以 致 于 其 本 质 无 法 被 一 个 没有 思想 的 机 械 过 程 捕 捉 呢 ? 


最 终 可 能 没有 严谨 的 答案 ， 因 为 这 个 问题 是 哲学 层面 的 而 非 科学 层面 的 。 一 个 算法 的 指令 
一 定 要 “简单 ”而 且 “ 不 精巧 "， 以 便 它 “ 能 由 一 个 人 计算 "， 但 这 些 对 人 类 的 直觉 和 能 力 
来 说 都 是 不 严密 的 ， 这 并 不 是 能 用 来 证 实 或 者 推翻 一 个 假设 的 数学 化 断言 。 


不 管 怎样 ， 我 们 都 可 以 通过 提出 大 量 算法 并 观察 我 们 选择 的 计算 系统 (图 灵机 、lambda 演 
算 、 部 分 递归 函数 ， 或 者 Ruby) 是 否 能 够 实现 它们 来 收集 证 据 。 数 学 家 和 计算 机 科学 家 
差不多 从 20 世纪 30 年 代 开 始 就 已 经 在 这 么 做 了 ， 但 到 目前 为 止 还 没有 人 成 功 设计 出 这 些 
系统 不 能 执行 的 算法 。 因 此 我 们 可 以 对 经 验 上 的 直觉 相当 自信 : 一 台 机 器 肯定 能 执行 任何 
算法 。 


男 一 个 比较 强 的 证 据 是 这 些 系统 中 大 多 数 都 是 为 了 尝试 捕捉 和 分 析 一 个 算法 的 非 形 式 化 思 
想 而 独立 发 展 的 ， 只 是 后 来 才 被 发 现 彼此 之 间 恰 好 等 价 。 每 一 次 对 算法 思想 的 建 模 尝试 都 
产生 了 一 个 系统 ， 这 个 系统 的 能 力 与 一 台 图 灵机 的 能 力 等 价 ， 而 这 是 对 一 台 图 灵机 足够 表 
示 一 个 算法 的 很 好 上 暗示。 
















































































任何 算法 都 能 被 一 台 机 器 (特别 是 一 台 确 定型 的 图 灵机 ) 执行 的 思想 叫 作 印 坷 一 图 灵 论 题 
(Church-Turing thesis)。 尽 管 这 仅仅 是 一 个 猜想 而 不 是 一 个 被 证 明 的 事实 ， 但 有 足够 的 证 
据 让 它 成 为 广泛 接受 的 真理 。 




















:A 


4 “图 灵机 能 执行 任何 算法 ”是 个 哲学 层面 的 断言 ， 说 的 是 算法 的 直观 感觉 和 
A 








ss。 用 来 实现 算法 的 形式 系统 之 间 的 关系 。 它 实际 的 含义 是 一 个 解释 的 问题 : 我 
会 ， 们 可 以 把 它 看 成 关于 什么 能 计算 以 及 什么 不 能 计算 的 命题 ， 或 者 作为 单词 
“算法 ”的 更 严格 的 一 个 定义 。 








不 管 怎样 ， 它 都 叫 “ 印 奇 一 图 灵 论 题 "， 而 不 是 “ 印 奇 一 图 灵 定 理 ”。 因 为 
它 是 一 个 非 形 式 化 的 断言 而 不 是 一 个 可 证 明 的 数学 断言 一 一 它 没 法 用 纯 数 学 
化 的 语言 表达 ， 因 此 没有 办 法 构建 数学 证 明 。 因 为 它 与 我 们 对 计算 本 质 的 直 
觉 判断 和 算法 能 做 事情 的 证 据 相符 ， 所 以 被 广泛 认为 是 真 的 ， 但 我 们 仍旧 称 
它 为 “论题 "， 以 便 提醒 自己 它 的 状态 与 毕 达 哥 拉 斯 定理 这 样 的 可 证 明 思想 
不 同 。 





















































印 奇 一 图 灵 论 题 表 明 ， 图 灵机 尽管 简单 ， 但 拥有 执行 任何 计算 所 需要 的 所 有 人 能力， 而 这 些 计 
算 原则 上 可 以 由 一 个 人 按照 简单 的 指令 执行 。 许 多 人 比 这 更 进一步 ， 他 们 认为 ， 既 然 所 有 对 
算法 编码 的 尝试 都 归结 到 了 与 图 灵机 能 力 等 价 的 通用 系统 上 ， 那 也 就 不 可 能 做 得 更 好 了 : 任 
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何 现实 世界 中 的 计算 机 或 者 编程 语言 只 能 做 到 与 图 灵机 做 的 一 样 多 的 事 ， 不 能 再 多 了 。 是 否 
最 终 有 可 能 构建 一 台 比 图 灵机 更 强大 的 机 器 一 一 能 使 用 外 来 的 物理 法 则 执行 超越 我 们 对 “ 算 
法 ”想象 的 任务 一 一 现在 还 不 能 确切 知道 ， 但 可 以 肯定 的 是 我 们 现在 不 知道 如 何 做 。 


8.1.2 能够 蔡 代 图 灵机 的 程序 

就 像 我 们 在 第 5 章 中 看 到 的 那样 ， 图 灵机 的 简单 性 使 得 为 一 个 特定 任务 设计 一 个 规则 手册 
非常 困难 。 为 了 避免 对 可 计算 性 的 研究 被 图 灵机 编程 烦琐 的 细节 干扰 ， 我 们 将 使 用 Ruby 
程序 作为 替身 ， 就 像 处 理 欧 几 里 得 算法 那样 。 
这 个 方法 可 行 要 归 因 于 通用 性 ;原则 上 ， 我 们 可 以 把 任何 的 Ruby 程序 转换 成 一 个 等 价 的 


图 灵机 ， 反 之 亦 然 。 因 此 一 个 Ruby 程序 与 一 台 图 灵机 相 比 不 多 不 少 正好 能 力 相 当 ， 从 而 
我 们 发 现 的 关于 Ruby 能 力 的 任何 限制 都 应 该 可 以 同样 适用 于 图 灵机 。 


























































































































一 个 明显 的 异议 是 Ruby 有 大 量 的 实用 函数 ， 而 图 灵机 没有 。Ruby 程序 可 以 访问 文件 系 
统 、 发 送 和 接收 网 络 上 的 消息 、 接 受用 户 输入 、 在 点 阵 式 显示 器 上 绘图 ， 等 等 ， 然 而 即使 
最 精致 的 图 灵机 规则 集合 也 只 能 在 一 条 纸 带 上 读 写 。 但 那 不 是 根本 的 问题 ， 因 为 所 有 这 些 
额外 的 函数 都 能 用 一 台 图 灵机 模拟 如 果 必 要 ， 我 们 可 以 把 纸 带 的 某 些 部 分 设计 成 用 来 表 
示 “ 文 件 系统 ”或 者 “网 络 ” 或 者 “显示 器 ”或 者 任何 东西 ， 并 把 对 这 些 区 域 的 读 写 处 理 
得 就 像 与 外 边 的 真实 世界 交流 一 样 。 这 些 增强 没有 一 个 能 改变 图 灵机 的 潜在 计算 能 力 ， 它 
们 只 是 提供 了 对 纸 带 上 活动 的 高 层次 的 解释 。 


在 实践 中 ， 我 们 可 以 完全 把 自己 限制 在 简单 的 Ruby 程序 避免 使 用 任何 有 和 争议 的 语言 特性 ， 
以 此 来 规避 这 个 异议 。 本 章 的 其 余部 分 ， 我们 写 程序 时 将 坚持 从 标准 输入 中 读 取 ， 进 行 一 
些 计 算 , 然后 等 结束 的 时 候 把 字符 串 写 到 标准 输出 ， 输 入 字符 串 与 一 台 图 灵机 纸 带 的 初始 
内 容 类 似 ， 而 输出 字符 串 类 似 最 终 的 纸 带 内 容 。 


8.1.3 ”代码 即 数据 
程序 有 两 种 身份 。 除 了 把 程序 当 作 控制 一 个 特定 系统 的 指令 之 外 ， 我 们 还 把 程序 看 成 是 纯 
数据 : 一 个 表达 式 树 ， 一 个 原始 字符 串 ， 或 者 甚至 一 个 大 的 数 。 这 种 双重 性 通常 会 被 程序 
员 认 为 理所当然 ， 但 程序 能 够 被 表示 成 数据 以 便 它 们 能 用 做 提供 给 其 他 程序 的 输入 ， 对 通 
用 计算 机 来 说 是 至 关 重 要 的 。 正 是 代码 和 数据 的 统一 才 使 得 软件 成 为 可 能 。 


我 们 在 通用 图 灵机 的 讨论 中 已 经 看 到 了 作为 数据 的 程序 ， 它 期 望 另 一 台 图 灵机 的 规则 手册 
能 作为 字符 序列 写 到 它 的 纸 带 上 。 像 Lisp” 和 XSLT 这 样 奇特 的 同体 异 构 编程 语言 〈 即 和 
序 与 数据 由 同样 的 结构 存储 ) ， 程 序 被 显 式 地 写成 语言 本 身 可 以 操纵 的 数据 结构 : 每 一 个 
Lisp 程序 是 一 个 称 为 s 表达 式 的 艇 套 列表 ， 而 每 一 个 XSLT 样式 表 是 一 个 XML 文档 。 





















































































































































注 3: Lisp 实际 上 是 一 个 编程 语言 的 家 族 ,包括 Common Lisp .Scheme 以 及 Clojure, 它 们 有 着 非常 类 似 的 语法 。 
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在 Ruby 当中 ,通常 只 有 人 解释 器 (至少 在 MRI 中 不 是 用 Ruby 写 的 ) 才 会 关心 程序 的 结构 
化 表示 ， 但 把 代码 当 作 数 据 的 原则 仍然 适用 。 考 虑 下 面 这 个 简单 的 Ruby 程序 : 





puts 'hello wor1d 





对 于 一 个 熟悉 Ruby 语法 和 语义 的 观察 者 来 说 ， 这 是 一 个 带 上 字符 串 hello world 把 一 个 


put 





s 消息 发 给 main 对象 的 程序 ， 它 的 执行 结果 就 是 Kernel#puts 方法 把 hello world 进行 


标准 输出 。 但 在 更 低 的 层次 上 ， 它 只 是 一 个 字符 序列 ， 并 且 因 为 字符 是 表示 成 字 市 的 ， 所 
以 最 终 这 个 序列 可 以 看 成 是 一 个 很 大 的 数 : 


>> program = "puts “hello world'" 

=> "puts 'hello world'" 

>> bytes in binary = program.bytes.map { |byte| byte.to s(2).rjust(8, '0') } 

=> ["01110000", "01110101", "01110100","01110011"，"00100000"，"00100111"， 
"01101000","01100101"，"01101100"，"01101100"，"01101111"，"00100000"， 
"01110111", "01101111", "01110010", "01101100",，"01100100"，"00100111"] 

>> number = bytes in binary.join.to i(2) 

=> 9796543849500706521102980495717740021834791 


从 某 种 意义 上 说 ，puts 'hello world' 是 Ruby 程序 数 979654384950070652110298049571 


774 




















0021834791。“ 反 过 来 说 ， 如 果 某 个 人 告诉 我 们 一 个 Ruby 程序 的 数字 , 我 们 很 容易 把 它 





转换 回程 序 并 执行 它 : 


>> number = 9796543849500706521102980495717740021834791 

=> 9796543849500706521102980495717740021834791 

>> bytes in binary = number.to s(2).scan(/.+?(?=.{8}*\z)/) 

=> ["1110000", "01110101", "01110100", "01110011"，"00100000"，"00100111"，, 
"01101000","01100101"，"01101100"，"01101100"，"01101111"，"00100000"， 
"01110111", "01101111", "01110010", "01101100",，"01100100"，"00100111"] 

>> program = bytes in binary.map { |string| string.to i(2).chr }.join 

=> "puts 'hello world'" 

>> eval program 

hello world 

=> nil 


， 把 程序 编码 成 大 数 是 为 了 把 它 存 储 到 硬盘 上 ， 把 它 联 接 互 联网 ， 以 及 把 它 提 供给 一 





解释 器 (解释 器 本 身 在 硬盘 上 也 是 一 个 大 数字 ! ) ， 以 便 让 一 个 特定 的 计算 发 生 。 


考 3 





人 ee Ruby 程序 都 有 一 个 独一无二 的 数 ， 那 么 我 们 可 以 自动 生成 所 有 

















合生 可 能 的 程序 ， 从 数字 1 开始 生成 程序 ， 然 后 生成 程序 2， 以 此 类 推 。 ”如果 用 
足够 长 的 时 间 做 下 去 的 话 ， 将 会 最 终 产生 下 一 个 热门 的 异步 Web 开发 框架 
然后 我 们 就 可 以 退休 颐养 天 年 了 。 





注 4: 
注 5: 











只 把 数字 赋值 给 语法 有 效 的 Ruby 程序 会 更 有 用 ， 但 那么 做 会 更 复杂 。 
那些 数字 中 的 大 多 数 都 不 表示 语法 有 效 的 Ruby 程序 ， 但 我 们 可 以 把 每 个 潜在 的 程序 提供 给 Ruby 解 
析 器 ， 如 果 有 任何 的 语法 错误 的 话 , 就 丢弃 掉 它 。 























8.1.4 可 以 永远 循环 的 通用 系统 
我 们 已 经 看 到 通用 目的 的 计算 机 是 通用 的 : 可 以 设计 一 台 能 模拟 其 他 任何 图 灵机 的 图 灵 
机 ， 或 者 写 一 个 能 对 其 他 任何 程序 求 值 的 程序 。 通 用 性 是 个 强大 的 思想 ， 这 样 不 同 的 任务 
只 用 一 台 可 改写 的 机 器 而 不 是 很 多 专门 机 器 就 可 以 完成 。 但 它 也 有 不 方便 的 地 方 : 任何 强 
大 到 足以 通用 的 系统 ， 都 不 可 避免 地 人 允许 我 们 构建 永 不 停机 一 直 循 环 的 计算 。 















































超 长 时 间 运 行 的 计算 
“我 想 要 说 的 是 ,” 计 算 机 史 哮 着 ,“ 我 的 电路 现在 已 经 无 法 撤销 地 开始 计算 生 
命 、 宇 宙 和 一 切 终极 问题 的 答案 。” 它 组 了 一 下 ， 对 现在 能 引起 所 有 人 的 注意 
感到 很 满意 ， 于 是 降低 了 音量 :“ 但 程序 运行 要 稍微 花费 我 一 点 儿 时 间 。” 


福 克 不 耐烦 地 曾 了 一 眼 他 的 手表 。 
“要 多 久 ? ”他 问 。 
“750 万 年 。 深思 回答 说 。 


一 一 道格拉斯 亚当斯, 《银河 系 漫 游 指 南 》 
(The Hitchhiker ’s Guide to the Galaxy) 


如 果 我 们 试图 执行 一 个 算法 一 一 目的 是 把 输入 转 成 输出 的 指令 列表 一 一 那么 永远 循环 
就 是 一 件 坏事 了 。 我 们 想 要 一 台 机 器 (或 者 程序 ) 在 有 限时 间 内 运行 然后 停机 并 给 出 
某 些 输出 ， 而 不 只 是 安静 地 在 那儿 变 热 。 所 有 其 他 都 相等 的 情况 下 ， 最 好 能 有 计算 机 
和 语言 ， 它 们 的 每 个 任务 都 保证 在 有 限 步 又 内 结束 ， 这 样 我 们 就 不 必 关 心 最 终 是 否 会 
有 答案 了 。 


但 是 在 一 些 实际 的 应 用 中 ， 永 远 循环 是 设计 好 的 。 例 如 ， 一 个 像 Apache 或 者 Ngnix 这 
样 的 Web 服务 器 如 果 只 能 接受 一 个 HTTP 请 求 ， 发 送 响应 然后 就 退出 的 话 ， 是 没什么 

用 的 ; 我 们 想 要 它 无 限期 运行 下 去 ， 在 强制 停止 前 继续 为 每 个 到 来 的 请 求 服 务 。 但 从 
概念 上 讲 ， 我 们 可 以 把 一 个 单线 程 的 Web 服务 器 分 成 两 部 分 : 一 是 处 理 单 个 请 求 的 代 
码 ， 它 应 该 总 是 能 停机 ， 以 便 能 发 送 响应 ， 二 是 它 的 外 边 应 该 有 一 个 无 限 循环 ， 能 随 
着 每 个 新 请 求 的 到 来 不 断 调 用 请 求 处 理 器 。 在 这 种 情况 下 ， 即 使 封装 器 需要 永远 运行 ， 
在 复杂 的 请 求 处 理 代码 里 无 限 循环 仍然 是 一 件 坏事 。 


真实 世界 提供 了 很 多 程序 的 实例 ， 它 们 在 一 个 无 限 循环 中 反复 执行 停机 计算 : Web 服 
务 器 、GUI 应 用 、 操 作 系 统 ， 等 等 。 尽 管 我 们 通常 想 要 算法 的 输入 输出 程序 总 能 停机 ， 
但 这 些 长 时 间 运 行 的 系统 的 类 似 目 标 是 高 效 ， 也 就 是 说 总 是 “保持 运行 ”并 且 永 远 都 
不 要 陷入 无 响应 的 状态 。 
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那么 为 什么 每 个 通用 系统 都 把 非 终结 作为 属性 呢 ?” 有 没有 什么 天 才 的 方法 能 限制 图 灵机 以 
便 它 们 总 是 能 停机 ， 而 不 必 在 它们 的 用 处 上 做 出 妥协 呢 ? 怎么 知道 我 们 某 一 天 不 会 设计 出 
一 种 编程 语言 ， 它 与 Ruby 一 样 强大 但 不 包含 无 限 循环 呢 ?” 对 于 为 什么 它们 无 法 做 到 有 各 
种 具体 的 例子 ， 但 还 有 一 个 更 通用 的 论据 ， 让 我 们 演练 一 下 。 








Ruby 是 一 种 通用 编程 语言 ， 因 此 写 一 个 能 对 Ruby 代码 求 值 的 Ruby 代码 一 定 是 可 能 的 。 
原则 上 讲 ， 我 们 可 以 定义 一 个 叫 #evaluate 的 方法 ， 它 的 参数 是 一 个 Ruby 程序 的 代码 和 
一 个 标准 输入 提供 给 程序 的 字符 串 ， 然 后 对 那个 程序 求 值得 到 结果 (也 就 是 说 ， 字 符 串 会 
发 给 标准 输出 )。 











在 本 章 中 包含 进 #evaluate 的 实现 过 于 复杂 了 ， 但 下 面 是 对 它 最 可 能 工作 方式 的 概括 : 


def evaluate(program, input) 
# 解析 程序 
# 在 捕获 输出 的 同时 基于 输入 对 程序 求 值 
# 返回 输出 

end 











方法 #evaluate 本 质 上 是 一 个 Ruby 写 的 Ruby 解释 器 。 尽 管 我 们 还 没有 对 其 实现 ， 但 写 出 
它 来 是 可 能 的 : 首先 把 程序 转 成 一 个 符号 序列 ， 然 后 分 析 它 们 构建 一 个 解析 树 (参见 4.3 
节 )， 再 根据 Ruby 的 操作 语义 (参见 2.3 节 ) 对 这 个 分 析 树 求 值 。 这 是 一 个 大 而 复杂 的 工 
作 ， 但 它 肯 定 能 完成 ， 不 然 的 话 ，Ruby 就 不 能 满足 通用 性 了 。 





为 了 简单 ， 假 设 我 们 对 #evaluate 的 假想 实现 是 无 bug 的 ， 在 它 对 程序 求 值 的 时 候 不 会 崩 
溃 。 当 然 它 可 能 会 返回 某 个 结果 ， 这 个 结果 表明 这 个 程序 在 求 值 的 过 程 中 会 引发 异常 ， 但 
那 与 #evaluate 本 身 实际 执行 中 的 崩溃 是 不 一 样 的 。 




















考 sa， 


Ruby 恰好 有 一 个 内 建 的 Kernel#eval 方法 能 对 Ruby 代码 的 字符 串 求 值 ， 但 
这 里 利用 这 个 方法 有 点 自 其 其 人 ,特别 是 因为 (在 MRI 中 ) 它 是 用 C 语言 
”实现 的 ， 而 不 是 Ruby。 它 对 当前 的 讨论 也 没有 必要 ; 我 们 把 Ruby 当 作 任意 
通用 编程 语言 的 典型 实例 ， 但 许多 通用 性 语言 没有 内 建 的 eval。 


























但 是 请 注意 ， 既 然 它 摆 在 那儿 ， 为 了 让 #evaluate 减少 一 点 想象 的 成 分 ， 我 
们 不 去 用 它 就 太 不 好 意思 了 。 下 面 是 一 次 粗略 的 尝试 ， 请 多 包涵 : 


require 'stringio’ 








def evaluate(program, input) 
old stdin, old stdout = $stdin, $stdout 
$stdin, $stdout = StringIO.new(input), (output = StringIO.new) 


begin 
eval program 
rescue Exception => e 
output.puts(e) 
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ensure 
$stdin, $stdout = old stdin, old stdout 
end 
output. string 
end 


实现 有 许多 现实 和 哲 字 上 的 同 通 ， 它们 都 能 通过 写 纯 Ruby 的 #evaluate 
来 避免 。 另 一 方面 ， 从 演示 角度 看 ， 这 个 实现 足够 简短 而 且 工 作 得 足够 好 : 


>> evaluate('print $stdin.read.reverse', 'hello world') 
=> "dlrow olleh" 

















方法 #evaluate 的 存在 允许 我 们 定义 另 一 个 方法 : #evaluate_on_itself， 它 返回 用 它 自 己 
的 源 代码 作为 输入 对 程序 求 值 的 结果 : 





def evaluate on itself(program) 
evaluate(program, program) 
end 








这 可 能 有 点 苑 唐 ， 但 是 完全 合法 ; 程序 只 是 一 个 字符 串 ， 因 此 我 们 完全 可 以 把 它 既 当 成 一 
个 Ruby 程序 又 当成 对 这 文 个 程序 的 输入 。 代 码 即 数据 ， 对 吧 ? 








>> evaluate on itself('print $stdin.read.reverse') 
=> "esrever.daer.nidts$ tnirp" 





既然 我 们 知道 可 以 用 Ruby 实现 #evaluate 和 #evaluate_on_itself， 因 而 就 能 写 出 完整 的 
Ruby 程序 does_it_say_no.rb: 





def evaluate(program, input) 
# 解析 程序 
# 在 捕获 输出 的 同时 基于 输入 对 程序 求 值 
# 返回 输出 
end 


























def evaluate on itself(program) 
evaluate(program, program) 
end 


program = $stdin.read 


if evaluate on itself(program) == “no' 
print “yes 

else 
print “no 

end 


个 程序 是 对 现 有 代码 的 一 个 直接 应 用 : 它 定 义 了 #evaluate 和 #evaluate on itself， 然 
0 Ruby 程序 ， 最 后 把 它 传 给 #evaluate_on_itself。 来 看 看 它 以 
自身 作为 输入 的 时 候 程序 能 干什么 。 如 果 输 出 的 结果 是 字符 串 'no' ，does_it_say_no.rb 会 
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输出 “yes ， 否 则 它 会 输出 “no 。 例 如 :“ 


$ echo 'print $stdin.read.reverse' | ruby does it say no.rb 
no 








这 是 期 望 的 结果 ， 就 像 我 们 上 面 看 到 的 ， 在 用 其 自身 运行 print$stdin.read.reverse 
时 ， 会 得 到 输出 esrever.daer.nidts$tnirp， 它 与 no 不 相等 。 得 到 输入 no 的 程序 会 怎么 
样 呢 ? 











$ echo “if $stdin.read.include?("no") then print "no" end' | ruby does it say no.rb 
yes 


这 次 仍然 与 期 望 一 致 。 


那么 下 面 是 大 问题 了 : 在 运行 ruby does_it_say_no.rb < does_it_say_no.rb 时 ， 会 发 生 什么 
呢 ? “在 脑子 中 要 记 住 does_it_say_no.rb 是 一 个 真实 的 程序 一 一 用 足够 的 时 间 和 热情 可 以 
完整 写 出 来 的 一 个 程序 因此 ， 它 一 定 有 结果 ， 只 是 没 那 么 显而易见 。 让 我 们 试 着 通过 
考虑 所 有 的 可 能 然后 去 掉 讲 不 通 的 来 把 它 实 现 出 来 。 

首先 ， 以 自身 代码 作为 输入 来 运行 这 个 特定 程序 不 能 产生 输出 yes。 根 据 程序 自己 的 逻辑 ， 


输出 yes 只 能 在 对 自身 代码 运行 does_it_say_no.rb 输出 no 时 才 会 发 生 ， 这 与 原来 的 承诺 是 
冲突 的 。 因 此 这 样 不 行 。 


好 吧 ， 那 么 可 以 改 为 输出 no。 但 程序 的 结构 意味 着 ， 只 有 同样 的 计算 没有 输出 no 它 才能 
输出 no 一 一 又 冲突 了 了。 


有 可 能 输出 一 些 其 他 字符 串 ， 比 如 maybe， 甚 至 空 字符 串 吗 ? 那 可 能 还 是 会 冲突 : 如 果 
evaluate on itself(program,program) 没有 返回 no 那 程序 还 是 会 输出 no。 















































因此 它 不 能 输出 yes 或 者 no， 不 能 输出 别 的 什么 ， 并 且 除 非 方 法 #evaluate 含有 bug， 不 
然 它 不 可 能 崩 涡 ， 但 这 个 已 经 假定 不 会 了 。 唯 一 的 可 能 性 是 它 不 产生 任何 输出 ， 而 这 只 会 
在 程序 永 不 停止 的 时 候 才 会 发 生 : #evaluate 一 定 要 永远 循环 ， 不 返回 结果 。 




















pd 和 


实际 上 几乎 可 以 确定 ruby does_it_say_no.rb < does_it_say_no.rb 将 会 耗 尽 主 
机 的 有 限 内 存 ， 引 起 ruby 崩溃， 而 不 会 真 的 永远 循环 下 去 。 但 这 是 外 部 施加 
”给 程序 的 资源 限制 ， 而 不 是 程序 本 身 的 属性 ， 理 论 上 讲 ， 只 要 有 和 需要 我 们 可 
以 持续 给 计算 机 增加 更 多 的 内 存 让 计算 机 无 限 运行 下 去 。 
































注 6: 我 们 这 里 使 用 的 是 Unix shell 语法 。 在 Windows 平台 上 ， 要 忽略 echo 参数 周围 的 单 引 号 ， 或 者 把 文 
本 放 到 文件 里 ， 并 把 它 用 < 输入 重 定 向 符 提 供给 ruby。 
注 7: 这 是 一 个 shell 命令 ， 以 它 自 身 源 代码 作为 输入 运行 does_it_say_no.rb。 
























































A 
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用 这 么 复杂 的 方式 说 明 Ruby 允许 我 们 写 不 停机 程序 看 起 来 是 没有 必要 的 。 毕 竟 while 
true do end 能 让 我 们 做 相同 的 事 ， 但 它 简单 得 多 。 








但 通过 思考 does_it_say_no.rb 的 行为 ， 我 们 已 经 展示 了 不 管 系统 有 什么 特性 ， 不 停机 程序 
是 通用 性 的 一 个 不 可 避免 的 结果 。 我 们 的 观点 除了 依赖 Ruby 的 通用 性 之 外 不 依赖 Ruby 
的 任何 特殊 能 力 ， 因 此 同样 的 思想 也 可 以 适用 于 图 灵机 ， 或 者 lambda 演算 ， 或 者 任何 其 
他 的 通用 系统 。 只 要 在 使 用 一 种 强大 到 能 对 自身 求 值 的 语言 ， 我 们 就 知道 一 定 可 能 使 用 
#evaluate 的 等 价 物 构 建 永 不 停机 的 程序 ， 而 不 需要 知道 关于 语言 能 力 的 任何 其 他 东西 。 























特别 地 ， 在 编程 语言 中 移 除 特性 (如 while 循环 ) 并 不 能 阻止 我 们 在 保持 语言 足以 通用 的 
同时 还 能 写 出 不 停机 的 程序 来 。 如 果 移 除了 一 个 特性 让 一 个 程序 无 法 永远 循环 ， 一 定 也 不 
可 能 实现 #evaluate 了 。 








被 仔细 地 设计 以 保证 它们 的 程序 一 定 总 是 能 停机 的 语言 叫 作 完全 编程 语言 。 与 之 相对 的 是 
更 常见 的 部 分 编程 语言 ， 这 样 语言 的 程序 有 时 候 能 停机 给 出 答案 ， 有 时 候 不 能 。 完 全 编程 
语言 仍然 非常 强大 ， 能 表达 许多 有 用 的 计算 ， 但 它们 不 能 做 到 的 就 是 解释 自身 。 











这 很 奇怪 ， 虽 然 对 一 种 完全 编程 语言 ， 从 定义 上 来 说 #evaluate 的 等 价 物 一 
心 。 定 总 是 能 停机 的 ， 但 用 那 种 语言 是 无 法 实现 的 一 一 如 果 它 可 以 实现 的 话 ， 我 
必 ， 们 就 能 使 用 does_it_say_no.rmb 技术 让 它 永 远 循环 了 。 





这 让 我 们 对 一 个 不 可 能 的 程序 有 了 初步 了 解 : 无 法 用 完全 编程 语言 写 一 个 对 
其 自身 的 解释 器 ， 即 使 为 了 解释 它 存在 一 个 令 人 尊敬 的 保证 能 停机 的 算法 也 
不 行 。 事 实 上 ， 它 是 如 此 令 人 尊敬 以 至 于 我 们 能 用 另 一 种 更 复杂 的 完全 编程 
语言 写 出 来 ， 但 这 个 新 的 完全 编程 语言 也 不 能 实现 它 自己 的 解释 器 。 




















虽然 是 个 有 意思 的 东西 ， 但 完全 编程 语言 的 设计 有 人 为 的 限制 ， 我 们 一 直 在 
寻找 所 有 计算 机 或 者 编程 语言 不 能 完成 的 东西 。 我 们 最 好 继续 努力 。 


8.1.5 能 引用 自身 的 程序 


does_it_say_no.rb 使 用 的 自 引 用 的 小 技巧 构建 出 一 个 能 读 自己 源 代码 的 程序 ， 但 或 许 假 定 
总 是 会 有 点 自 其 其 入。 在 我 们 的 例子 里 ， 程 序 收 到 了 自己 的 源 代码 作为 一 个 明确 的 输入 ， 
这 要 感谢 环境 (如 shell) 提供 的 功能 ， 要 没有 这 个 选择 的 话 ， 它 可 能 也 会 利用 Ruby 的 文 
件 系统 API 和 总 是 包含 当前 文件 名 的 _FILE。_ 常量 ， 直 接 用 File.read(_FILE_) 从 硬盘 
读 取 数 据 。 


但 我 们 应 该 提出 一 个 通用 的 论点 ， 只 依赖 Ruby 的 通用 性 ， 而 不 是 依赖 操作 系统 或 者 File 
类 的 能 力 。 像 Java 和 C 这 样 运行 时 没有 权限 访问 自身 产 代 码 的 编译 语言 呢 ? 像 JavaScript 
这 样 通过 网 络 连接 被 加 载 到 内 存 而 且 可 能 根本 不 会 存储 到 本 地 文件 系统 的 程序 呢 ? 像 图 灵 
机 和 lambda 演算 这 样 自 包含 的 通用 系统 ， 它 们 根本 没有 “文件 系统 ”和 “标准 输入 ”的 
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念 ， 又 会 怎样 呢 ? 


幸运 的 是 ，does_it_say_no.rb 参数 能 经 受 住 这 些 异 议 ， 因 为 让 一 个 程序 从 标准 输入 读 取 它 自 
己 的 源 代码 只 不 过 是 一 个 对 所 有 通用 系统 都 能 完成 的 某 个 事情 的 为 简化 ， 而 且 与 它们 的 环 
境 和 其 他 特性 无 关 。 这 是 一 个 叫 作 Kleene 第 二 递归 定理 的 推论 (Kleene’s second recursion 
theorem) ， 它 保证 了 任何 程序 都 可 以 转换 成 能 计算 自身 源 代 码 的 等 价 物 。 递 归 理论 提供 了 
我 们 所 做 简化 的 合理 保证 : 本 可 以 把 program = $stdin.read 用 一 些 代 码 蔡 换 ， 以 便 生 成 
does_it_say_no.rb 的 源 代 码 并 把 它 赋 给 程序 而 不 必 进 行 任何 IO。 


来 看 看 如 何在 一 个 简单 的 Ruby 程序 上 做 这 种 转换 。 例 如 : 














我 们 想 要 把 它 转换 成 类 似 这 样 的 程序 : 


program = " 
外 三 法 

二 
puts x+y 


ee 这 里 程序 被 赋予 了 一 个 含有 完整 程序 源 代码 的 字符 串 。 但 程序 的 值 应 该 是 多 少 呢 ? 


一 个 天 真 的 做 法 是 尝试 编造 一 个 能 赋值 给 程序 的 简单 字符 串 ， 但 这 很 快 就 会 让 我 们 陷入 麻 
烦 ， 因 为 这 个 字符 串 将 是 程序 源 代 码 的 一 部 分 从 而 会 出 现在 自身 的 某 个 地 方 。 这 会 要 求 程 
序 以 字符 串 “program =' 开头 ， 后 边 是 程序 的 值 ， 这 个 值 还 会 是 字符 串 “program ='， 后 边 
再 跟着 程序 的 值 ， 这 样 一 直 类 推 下 去 : 


program = %q{program = %q{program = %q{program = %q{program = %q{program = %q{...}}}}}} 
X 二 于 


ye 
puts x+y 














:A 


4 Ruby 的 %q 语法 允许 我 们 使 用 一 对 定 界 符 来 引用 不 可 修改 的 字符 串 ， 在 这 个 
4 
MY 

4 














、 场 景 下 是 花 括号 ， 而 不 是 一 对 引号 。 优 点 是 只 要 定 界 符 能 正确 匹配 ， 这 个 字 
:” 符 串 就 可 以 包含 定 界 符 的 非 转 义 实例 : 


>> puts %q{Curly brackets look like { and }.} 

Curly brackets look like { and }. 

> 

>> puts %q{An unbalanced curly bracket like } is a problem.} 
SyntaxError: syntax error, unexpected tIDENTIFIER, expecting end-of-input 








使 用 %q 而 不 是 单 引号 可 以 帮助 我 们 避免 令 人 头疼 的 包含 自身 定 界 符 的 字符 
串 里 的 字符 转 义 : 


program = 'program = \'program = \\\'program = \\\\\\\ .AAAANNWANNAN 








从 这 个 “ 坑 ” 里 疏 出 来 的 方法 是 利用 一 个 事实 ， 那 就 是 一 个 程序 中 用 到 的 值 没有 必要 出 现 
在 它 的 源 代码 里 ， 还 可 以 从 其 他 数据 动态 计算 出 来 。 这 意味 着 我 们 可 以 把 转换 的 程序 构建 
成 三 部 分 : 


A. 把 一 个 字符 串 赋 值 给 一 个 变量 (如 data) ; 
B. 使 用 字符 串 计 算 当 前 程序 的 源 代 码 并 将 其 赋值 给 pragram 
C. 做 程序 应 该 做 的 所 有 其 他 工作 (原来 代码 的 工作 )。 


因此 ， 程 序 的 结构 将 会 变 成 这 样 











data = "..." 
program = ... 
X=1 
JE 

puts X + y 

















这 作为 一 个 一 般 策 略 听 起 来 貌似 有 理 ， 但 在 具体 的 细节 上 还 有 些 问题 。 我 们 怎么 知道 A 部 
分 中 要 赋值 给 data 什么 字符 串 ， 并 且 我 们 怎么 用 其 在 B 部 分 中 对 pragram 进行 计算 呢 ? 下 
面 是 一 个 解决 方案 。 


。 在 A 部 分 中 ， 创 建 一 个 包含 B 和 C 部 分 的 字符 串 ， 并 把 这 个 字符 串 赋 值 给 data。 这 个 
字符 串 不 应 该 “包含 自身 "， 因 为 它 不 是 整个 程序 的 源 代码 ， 只 包含 A 部 分 之 后 的 部 分 
程序 。 

。 在 B 部 分 中 ,首先 计算 一 个 含有 A 部 分 源 代 码 的 字符 串 。 因 为 A 部 分 通常 含有 一 个 值 
可 用 作 data 的 大 的 字符 串 ， 所 以 我 们 可 以 这 么 做 。 因 此 只 需要 用 'data =' 给 data 的 值 
加 上 前 级 ， 以 此 来 重建 A 部 分 的 源 代码 。 然 后 只 是 把 这 个 结果 与 data 连接 起 来 得 到 整 
个 程序 的 源 代码 (因为 data 含有 B 部 分 和 C 部 分 的 源 代码 了 ) 并 将 其 赋值 给 程序 。 









































这 个 设计 仍然 有 些 不 够 直接 (A 部 分 产生 B 部 分 的 源 代码 ， 而 B 部 分 产生 A 部 分 的 源 代 
码 )， 但 它 通过 保证 B 部 分 只 计算 A 部 分 的 源 代码 而 不 必 把 它 包 含 进来 ， 这 刚好 避免 了 无 
限 的 倒退 。 








先 把 已 知 的 做 出 来 吧 。 我 们 已 经 有 了 B 和 C 部 分 的 大 部 分 源 代码 ， 因 此 可 以 部 分 地 完成 数 
据 的 值 了 : 


data = %q{ 
program = ... 
X=1 
y=2 

puts x+y 














program = ... 
X = 工 
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赚 六 





data 需要 换行 符 。 通 过 在 一 个 不 可 修改 的 字符 串 里 把 这 些 表示 为 现行 的 换 


粘贴 让 A 部 分 的 源 代 码 更 容易 计算 。 


nA I 行 符 ， 而 不 是 表示 成 可 修改 的 \n 转 义 序列 ， 我 们 就 能 把 B 和 C 部 分 的 源 代 
”人 码 逐 字 的 包括 进来 ， 而 不 必 进 行 任何 特殊 的 编码 的 转 义 。* 这 样 直接 的 复 和 





| 


我 们 还 知道 A 部 分 的 源 代码 只 是 字符 串 'data = %q{...}'"， 再 加 上 花 括号 中 间 填 充 好 的 


data 





的 值 ， 因 此 还 可 以 部 分 地 完成 pragran 的 值 : 


data = %q{ 
program = ... 





现在 所 有 pragram 中 缺失 的 就 是 B 和 C 部 分 的 源 代码 了 ， 这 恰好 就 是 data 包含 的 内 容 ， 
因此 我 们 可 以 把 data 的 值 添 加 到 程序 来 完成 任务 : 


最 后 


data = %q{ 
program = ... 
X = 工 

= 2 

puts X + y 

} 
program = "data = %q{#{data}}" + data 
X = 工 

y=2 

puts x+y 





， 回 头 改 进 一 下 data 的 值 以 反映 B 部 分 : 





data = %q{ 

program = "data = %q{#{data}}" + data 
X=1 

y=2 

puts x+y 

} 
program = "data = %q{#{data}}" + data 
X = 工 

= 2 

puts X + y 








注 8: 




















因为 B 和 C 部 分 恰好 不 包含 任何 如 反 斜 杠 或 者 不 平衡 花 括号 的 字符 ， 我 们 才能 


绕 行 成 功 。 如 果 它 们 


包含 的 话 ， 我 们 就 得 想 办 法 对 它们 转 义 然后 作为 汇编 pragram 值 的 一 部 分 撤销 掉 转 义 。 
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就 是 它 了 ! 这 个 程序 和 原来 的 作用 一 样 ， 但 现在 它 有 了 额外 的 含有 自身 代码 的 本 地 变量 ， 
可 它 实 际 上 没 用 那个 变量 做 任何 事情 。 如 果 转 换 一 个 程序 ， 它 需要 一 个 程序 的 本 地 变量 ， 
然后 用 它 做 点 什么 ， 那 会 怎么 样 呢 ?” 看 下 面 这 个 经 典 的 例子 : 

















puts program 











这 是 一 个 尝试 输出 它 自己 源 代码 的 程序 ,“ 但 它 明 显 会 失败 。 因 为 program 是 一 个 未 定义 的 
变量 。 如 有 果 我 们 通过 自 引 用 的 变换 来 运行 它 ， 可 以 得 到 如 下 结果 : 


| 


data = %q{ 
program = "data = %q{#{data}}" + data 
puts program 


program = "data = %q{#{data}}" + data 
puts program 


有 点 意思 了 。 让 我 们 在 控制 台 上 看 看 这 个 代码 能 干什么 : 


>> data = %q{ 
program = "data = %q{#{data}}" + data 
puts program 


=> "\nprogram = \"data = %q{\#{data}}\" + data\nputs program\n" 

>> program = "data = %q{#{data}}" + data 

=> "data = %q{\nprogram = \"data = %q{\#{data}}\" + data\nputs program\n}\n 
program = \"data = %q{\#{data}}\" + data\nputs program\n" 

>> puts program 

data = %q{ 

program = "data = %q{#{data}}" + data 

puts program 

} 
program = "data = %q{#{data}}" + data 
puts program 

=> nil 





可 以 确定 了 ，puts progranm 实际 上 输出 了 整个 程序 的 源 代码 。 


很 明显 这 个 变换 不 依赖 程序 本 身 的 任何 特别 的 属性 ， 因 此 对 任何 Ruby 程序 它 都 能 工作 ， 
而 且 不 必 使 用 $stdin.read 或 者 File.read(_FILE _) 读 取 程序 自身 的 源 代 码 。” 它 也 不 依 
赖 Ruby 本 身 的 任何 特别 属性 一 一 只 需要 像 任 何其 他 通用 系统 一 样 根据 旧 值 计算 新 值 的 能 
力 一 一 这 意味 着 任何 图 灵机 都 能 引用 它 自己 的 编码 ， 任 何 lambda 演算 表达 式 都 能 扩展 成 
含有 表示 它 自身 语法 的 lambda 演算 表达 式 ， 以 此 类 推 。 
























































注 9: 侯 世 达 (Douglas Hofstadter) 为 输出 自己 的 程序 杜撰 了 名 字 奎 因 (quine)。 
注 10: 是 不 是 忍 不 住 要 写 一 个 能 对 任意 Ruby 程序 执行 这 个 转换 的 Ruby 程序 了 ? 如 果 使 用 %q{[] 来 引用 数 
据 的 值 ， 那 你 如 何 处 理 原始 代码 中 的 反 斜 枉 和 不 平衡 的 大 括号 呢 ? 
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8.2 可 判定 性 

到 目前 为 止 我 们 已 经 看 到 图 灵机 有 非常 多 的 能 力 和 灵活 性 ， 它们 可 以 执行 编码 成 数据 的 任 
意 程序 ， 执 行 我 们 能 想 出 来 的 任意 算法 ， 运 行 无 限 长 时 间 ， 对 它们 自身 的 描述 进行 计算 。 
尽管 它们 很 简单 ， 可 这 些小 的 假想 的 机 器 都 已 经 被 证 明 能 表示 一 般 的 通用 系统 。 

















如 有 果 它 们 这 么 强大 而 灵活 ， 那 是 否 存在 图 灵机 乃至 真实 世界 的 计算 机 和 编程 语言 不 能 做 的 
事情 呢 ? 














在 回答 这 个 问题 之 前 ， 需 要 让 这 个 问题 更 明确 一 些 。 我 们 可 以 让 一 台 图 灵机 做 什么 样 的 事 
情 呢 ? 怎么 识别 它 已 经 干 完了 呢 ? 需要 研究 每 一 种 可 能 的 问题 吗 ? 或 者 只 考虑 其 中 一 部 分 
问题 是 否 足 够 呢 ? 我 们 只 是 在 寻找 解法 超越 自己 当前 理解 的 问题 ， 还 是 在 寻找 已 经 知道 永 
远 不 能 解决 的 问题 呢 ? 











也 





























我 们 可 以 通过 集中 在 判定 性 问题 上 以 缩小 问题 范围 。 判 定性 问题 的 答案 为 是 或 者 否 ， 就 像 
“2 比 3 小 吗 ? ”或 者 “正则 表达 式 (a(|b))* 与 字符 串 'abaab' 匹配 四? ”功能 性 问题 的 答 
案 是 一 个 数 或 者 某 个 非 布尔 值 ， 如 “18 和 12 的 最 大 公约 数 是 多 少 ? ”判定 性 问题 比 处 理 
功能 性 问题 要 容易 一 些 ， 但 它们 仍然 很 有 趣 ， 值 得 我 们 研究 。 





如 果 存 在 一 个 算法 ， 对 任何 可 能 的 输入 都 能 保证 在 有 限时 间 内 解决 一 个 判定 性 问题 ， 那 么 
这 个 问题 就 是 可 判定 的 〈 或 者 叫 可 计算 的 )。 印 奇 一 图 灵 论 题 认为 每 一 个 算法 都 能 由 图 灵 
机 执行 ， 所 以 对 于 一 个 可 判定 性 的 问题 ， 我 们 需要 设计 一 台 总 是 产生 正确 答案 的 图 灵机 ， 
并 且 如 果 运 行 足够 长 的 时 间 ， 它 总 是 能 停机 。 把 一 台 图 灵机 的 最 终 配置 解释 成 “是 ”或 者 
“ 否 ”的 答案 是 很 简单 的 : 例如 可 以 检查 在 当前 纸 带 的 位 置 上 是 否 写 有 Y 或 者 N， 或 者 完全 
忽略 纸 带 内 容 ， 而 只 是 检查 它 的 最 终 状 态 是 接受 状态 〈 是 ”) 还 是 非 接受 状态 (“ 否 ”)。 





















































前 几 章 的 所 有 判定 问题 都 是 可 判定 的 。 如 “有 限 状 态 自动 机 能 接受 这 个 字符 串 吗 ? ”和 
“这 个 正则 表达 式 匹 配 这 个 字符 串 吗 ? ”不 证 自明 是 可 判定 的 ， 因 为 我 们 已 经 写 了 Ruby 程 
序 以 便 通过 直接 模拟 有 限 自 动机 解决 它们 。 给 我 们 足够 的 时 间 和 精力 ， 那 些 程序 可 以 费力 
地 转换 成 图 灵机 ， 而 且 因为 它们 的 执行 包含 有 限 的 步骤 一 -DEFA 模拟 的 每 一 步 会 消耗 输 
入 的 一 个 字符 ， 而 输入 的 是 有 限 数 目的 字符 一 一 它们 能 保证 总 是 停机 给 出 是 或 者 否 的 答案 
来 ， 因 此 原来 的 问题 都 满足 可 判定 的 条 件 。 





























其 他 问题 有 些微 妙 。“ 这 个 下 推 自 动机 能 接受 这 个 字符 串 吗 ? ”可 能 看 起 来 不 是 可 判定 的 ， 
因为 我 们 已 经 看 到 用 Ruby 对 一 台 下 推 自动 机 的 直接 模拟 有 可 能 永远 循环 ， 也 不 会 给 你 答 
案 。 但 是 ， 恰 好 存在 一 种 方式 可 以 准确 地 计算 出 一 台 特 定 的 下 推 自 动机 为 了 接受 和 拒绝 一 

















个 给 定 长 度 的 输入 字符 串 要 经 过 多 少 模拟 步骤 ， ”因此 问题 终究 是 可 判定 的 : 我 们 只 是 计 
算 所 需要 的 步 数 ， 对 那些 步骤 运行 模拟 ， 然 后 检查 输入 是 否 已 经 被 接受 了 。 


那 每 次 都 能 这 么 做 吗 ? 总 是 存在 一 种 聪明 的 方式 接近 一 个 问题 然后 找到 一 种 方法 实现 一 人 台 
机 器 ,或 者 一 个 程序 ， 让 它 保证 能 在 有 限时 间 内 解决 这 个 问题 吗 ? 


好 吧 ， 不 行 ， 不 滁 的 是 不 行 。 有 许 一 一 无 限 多 一 一 多 判定 性 问题 而 且 大 量 的 问题 是 不 可 判 
定 的 : 没有 保证 能 停机 的 算法 能 解决 它们 。 这 些 问 题 中 每 一 个 都 是 不 可 判定 的 ， 不 是 因为 
我 们 还 设 有 找到 合适 的 算法 ， 而 是 因为 问题 本 身 从 本 质 上 就 对 某 些 输入 不 可 能 解决 ， 而 我 
们 可 以 证 明永 远 也 不 会 找到 合适 的 算法 。 


8.3 停机 问题 

大 量 的 非 判 定性 问题 是 关于 机 器 和 程序 执行 过 程 中 的 行为 的 。 这 其 中 最 著名 的 就 是 停机 问 
题 ， 停 机 问题 要 解决 的 是 对 拥有 一 条 特定 纸 带 的 特定 图 灵机 判定 它 的 执行 是 否 能 够 停机 。 
感谢 通用 性 ， 我 们 可 以 把 同样 的 问题 用 更 实际 的 名 词 重 讲 一 过: 给 定 一 个 包含 Ruby 程序 
源 代 码 的 字符 串 ， 还 有 一 个 数据 的 字符 串 可 以 让 程序 从 标准 输入 中 读 取 ， 那 么 运行 这 个 程 
序 最 终 会 得 到 一 个 答案 作为 结果 还 是 只 会 无 限 循 环 下 去 呢 ? 




















8.3.1 构建 停机 检查 器 
停机 问题 应 该 被 看 成 是 不 可 判定 的 ， 尽 管 原因 并 不 明显 。 对 于 一 个 可 回答 的 问题 写 出 程序 
是 比较 容易 的 。 下 面 是 一 个 不 管 它 的 输入 字符 串 是 什么 ， 都 能 确定 停机 的 程序 : 


input = $stdin.read 
puts input.upcase 


我 们 假设 $stdin.read 总 是 会 立即 返回 一 个 值 一 一 换 名 话说， 每 个 程序 的 标 
心 。 准 输入 是 有 限 的 和 不 会 阻塞 的 一 一 因为 我 们 关注 的 是 程序 的 内 部 行为 ， 而 不 


司 ， 是 它 与 操作 系统 的 交互 。 








反 过 来 说 ， 对 源 代 码 做 小 小 的 改动 就 可 以 产生 一 个 明显 永远 不 停机 的 程序 : 





input = $stdin.read 


while true 











注 11: 简 言 之 就 是 : 每 一 台 下 推 自动 机 都 有 一 个 上 下 文 无 关 文 法 ， 反 之 亦 然 ， 任 何 上 下 文法 都 可 以 用 乔 姆 
斯 基 范 式 重 写 ， 这 种 范式 下 的 任何 上 下 文 无 关 文 法 为 了 生成 长 度 为 n 的 字符 串 一 定 要 经 历 2n-1 步 。 
因此 我 们 可 以 把 原始 的 PDA 转 成 一 个 上 下 文 无 关 文法 ， 把 上 下 文 无 关 文 法 重 写成 乔 姆 斯 基 范 式 ， 然 
后 把 这 个 上 下 文 无 关 文法 转换 回 PPDA。 由 此 产生 的 下 推 自动 机 与 原来 的 机 器 能 识别 同样 的 语言 ， 但 
现在 我 们 准确 地 知道 完成 它 需 要 多 少 步 了 。 
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# 什么 也 不 做 


end 


puts input.upcase 


我 们 当然 可 以 写 出 一 个 停机 检查 器 来 区 分 这 两 种 情况 。 只 是 测试 程序 的 源 代码 是 否 含有 字 
符 串 while true 就 够 了 : 


def halts?(program, input) 
if program.include?('while true') 
false 
else 
true 
end 
end 


这 个 #halts? 方法 的 实现 在 下 面 两 个 示例 程序 中 会 给 出 正确 的 答案 : 





>> always = "input = $stdin.read\nputs input.upcase" 

=> "input = $stdin.read\nputs input.upcase" 

>> halts?(always, 'hello world') 

=> true 

>> never = "input = $stdin.read\nwhile true\n# do nothing\nend\nputs input.upcase" 
=> "input = $stdin.read\nwhile true\n# do nothing\nend\nputs input.upcase" 

>> halts? (never, 'hello world') 

=> false 


但 #halts? 对 其 他 程序 很 可 能 是 错 的 。 例 如 ， 存 在 这 样 的 程序 ， 它 们 的 停机 行为 依赖 于 它 
们 的 输入 值 : 














input = $stdin.read 


if input.include?('goodbye') 
while true 
# 什么 也 不 做 
end 
else 
puts input.upcase 
end 


因为 知道 搜索 什么 ， 所 以 我 们 可 以 总 是 扩展 停机 检查 器 来 处 理 这 样 的 特殊 情况 : 


def halts?(program, input) 
if program.include?('while true') 
if program.include?('input.include?(\'goodbye\')') 
if input.include?('goodbye') 
false 
else 
true 





end 
else 
true 
end 
end 


现在 我 们 有 了 一 个 检查 器 ， 它 能 对 三 个 程序 和 任意 可 能 的 输入 字符 串 给 出 正确 的 答案 : 





>> halts?(always, "hello world') 

=> true 

>> halts? (never, 'hello world') 

=> false 

>> sometimes = "input = $stdin.read\nif input.include?('goodbye')\nwhile true\n 
# 执行 nothing\nend\nelse\nputs input.upcase\nend" 

=> "input = $stdin.read\nif input.include?('goodbye')\nwhile true\n# do nothing\n 
end\nelse\nputs input.upcase\nend" 

>> halts?(sometimes, 'hello world') 

=> true 

>> halts? (sometimes, 'goodbye world') 

=> false 


我 们 可 以 像 这 样 无 限 继 续 下 去 ， 增 加 更 多 的 检查 和 更 多 的 特殊 情况 ， 以 支持 对 实例 程序 的 
所 有 扩展 ， 但 我 们 永远 都 无 法 得 到 判定 任意 程序 是 否 会 停机 的 全 部 问题 的 答案 。 一 个 暴力 
的 实现 可 能 会 越 来 越 准 确 ， 但 总 是 会 有 盲点 ， 简单 的 查找 特殊 语法 模式 的 方法 不 可 能 满足 
所 有 的 程序 。 


让 #halts? 能 在 通常 情况 下 对 任何 可 能 的 程序 和 输入 都 工作 看 起 来 有 些 困难 。 如 果 一 个 程 
序 含有 任何 循环 一 一 不 管 是 显 式 的 ， 如 while 循环 ， 或 者 隐 式 的 ， 如 递归 方法 调用 一 一 那 
它 都 有 可 能 一 直 运 行 下 去 ， 预 测 对 于 给 定 输 入 的 任何 东西 都 需要 对 程序 含义 的 熟练 分 析 。 
作为 人 类 ， 我 们 可 以 立即 看 出 来 下 面 这 个 程序 总 是 能 停机 : 















































input = $stdin.read 
Output = "" 


n = input.1length 
until n.zero? 
Output = Output + '*' 





n=n- 
end 
puts output 


但 是 为 什么 它 总 是 能 停机 呢 ? 当然 不 是 因为 任何 直接 的 语法 原因 。 解 释 是 I0#read 总 会 
返回 一 个 String， 而 String#length 总 会 返回 一 个 非 负 的 Integer， 并 且 不 断 对 非 负 的 
Integer 调用 - (1) 最 终 总 是 会 产生 一 个 对 象 ， 它 的 #zero? 方法 会 返回 true。 这 个 推 
理 链 很 微妙 而 且 对 于 小 的 修改 会 高 度 敏感 ， 如 果 循 环 中 的 语句 n=n-1 变 成 n=n-2， 程 序 
和 只 会 在 偶数 长 度 个 输入 时 才 会 停机 。 停 机 检查 器 需要 知道 所 有 这 些 关 于 Ruby 和 数 的 
和 实 ， 还 要 知道 如 何 把 事实 连 到 一 起 以 便 对 这 种 程序 的 判定 能 准确 。 这 样 的 检查 器 需要 
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gg 最 基本 的 困难 是 不 实际 执行 一 个 程序 很 难 预测 它 将 会 干什么 。 运 行程 序 
人 8 eaeaee 和 是 人 人 的， 人 有 外， 和 和 站 人 
全， 机 ，#evaluate 将 会 永远 运行 下 去 ， 而 不 管 我 们 等 多 入， 都 不 会 从 #halts? 
获得 任何 应 答 。 任 何 可 以 依赖 的 停机 检测 算法 都 需要 在 有 限 的 时 间 内 通过 
检查 和 分 析 程 序 的 文本 来 生成 确定 的 答案 ， 而 不 是 单纯 依靠 运行 程序 和 
等 待 。 




















8.3.2 ”永远 不 会 有 结果 

好 吧 ， 直 觉 告 诉 我 们 #halts? 很 难 正确 实现 ， 但 那 并 不 意味 着 停机 问题 是 不 可 判定 的 。 有 
大 量 的 难题 (例如 写 出 #evaluate) 被 证 明 只 要 付出 足够 的 努力 和 创造 力 ， 都 是 能 解决 的 。 
如 果 停 机 问题 是 不 可 判定 的 ， 那 就 意味 着 #halts? 不 止 是 极端 困难 ， 而 是 不 可 能 写 出 来 。 























如 何 才能 知道 #halts? 的 恰当 实 存在 呢 ? 如 果 它 仅仅 是 一 个 工程 问题 ， 为 什么 我 
们 不 能 投入 大 量 的 程序 员 ， 并 最 终 获 得 一 个 解决 方案 呢 ? 


洁 
ea 
0 
ed 
GE 








1. 好 得 不 真实 

我 们 假设 停机 问题 是 可 判定 的 。 在 这 个 假想 的 世界 里 ， 写 一 个 #halts? 的 完整 实现 是 可 能 
的 ， 因 此 对 #halts?(program,input) 的 调用 在 任何 program 和 input 下 ， 总 是 返回 true 或 
者 false， 并 且 如 果 以 标准 输入 的 input 运行 ， 这 个 答案 总 是 能 正确 地 预测 program 是 否 能 
停机 。 方 法 #halts? 的 原始 结构 可 能 像 下 面 这 样 : 




















def halts?(program, input) 

# 解析 程序 

# 分 析 程 序 

# 如 果 程 序 在 输入 上 停机 ， 就 返回 true， 否 则 返回 false 
end 

















如 果 可 以 写 #halts?， 那 么 我 们 可 以 构建 does_it_halt.rb， 这 个 程序 能 读 取 另 一 个 程序 ( 作 
为 输入 )， 并 在 读 取 到 空 字 符 串 的 时 候 根 据 那 个 程序 是 否 停机 来 输出 yes 或 者 no: “ 























def halts?(program, input) 

# 解析 程序 

# 分 析 程 序 

# 如 果 程序 在 输入 上 停机 ， 就 返回 true， 否 则 返回 false 
end 


def halts on empty? (program) 








注 12: 空 字符 串 的 选择 并 不 重要 ， 只 是 任意 的 一 个 固定 输入 。 这 个 设计 是 在 自 包含 的 程序 上 运行 does_it_ 
haltrb， 程 序 不 从 标准 输入 读 取 任何 东西 ， 因 此 输入 是 什么 并 不 重要 。 
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halts?(program, '') 
end 


program = $stdin.read 


if halts on empty?(program) 
print “ yes 

else 
print “no 

end 





有 了 does_it_halt.rb 之 后 , 就 可 以 使 用 它 解 决 非常 难 的 问题 。 考 虑 一 下 1742 年 克里斯蒂 安 ， 
哥 德 巴赫 提出 的 著名 论断 : 


任何 一 个 大 于 2 的 整数 都 可 以 写成 两 个 质数 之 和 。 


这 就 是 哥 德 巴赫 猜想 ， 因 为 还 没有 人 能 证 明 它 是 真 还 是 假 ， 所 以 它 很 著名 。 有 证 据 表 明 它 
是 真 的 ,因为 任 选 的 一 个 偶数 总 是 可 以 分 成 两 个 质数 一 -12 =5+7、34=3+31、567 890 
=7+ 567 883， 等 等 一 一 已 经 检查 过 它 对 4 和 4 000 000 000 000 000 000 之 间 的 所 有 偶 
数 都 成 立 。 但 存在 无 限 多 个 偶数 ， 因 此 没有 计算 机 能 把 它们 都 检查 出 来 ， 对 每 个 偶数 一 
定 可 以 用 这 种 方式 拆 分 也 没有 已 知 的 证 明 。 尽 管 可 能 性 小 ， 但 仍 有 可 能 存在 某 个 非常 大 的 
偶数 不 是 两 个 质数 的 和 。 








证 明 哥 德 巴 赫 猜 想 是 数论 的 圣杯 之 一 。2000 年 ， 英 国 费 伯 出 版 社 悬 赏 100 万 美元 给 能 证 明 
哥 德 巴赫 猜想 的 人 。 但 等 一 下 : 我 们 已 经 有 了 能 发 现 这 个 猜想 是 真 的 工具 了 啊 ! 只 需要 写 
一 个 程序 ， 搜 索 反 例 即 可 : 








require 'prime' 


def primes less than(n) 
Prime.each(n - 1).entries 
end 


def sum of two primes?(n) 

primes = primes less than(n) 

primes.any? { |al primes.any? { |b| a+b ==n}} 
end 


n=4 


while sum of two primes?(n) 


n=n+2 
end 
print n 














这 在 哥 德 巴赫 猜想 的 真实 性 和 一 个 程序 的 停机 行为 之 间 建 立 了 联系 。 如 有 果 猜 想 是 真 的 ， 这 
个 程序 将 永远 无 法 找到 反例 ， 不 管 它 计 数 到 多 少 ， 因 此 它 将 会 永远 循环 下 去 ， 如 果 猜 想 是 
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假 的, n 将 最 终 被 赋予 一 个 偶数 值 ， 这 个 偶数 值 不 是 两 个 质数 的 和 ， 并 且 程 序 将 会 停机 。 
因此 我 们 只 需要 把 它 保存 成 goldbach.rb 并 运行 ruby does_it_halt.rb < goldbach.rb， 以 查 明 
这 是 否 是 一 个 停机 程序 ， 而 那 将 告诉 我 们 哥 德 巴赫 猜想 是 否 是 真 的 。100 万 美元 是 我 们 的 
和 


好 了 ， 很 明显 这 好 得 都 不 真实 了 。 写 出 能 准确 预测 goldbach.rb 行为 的 程序 将 会 要 求 精通 超 
越 我 们 当前 理解 的 数论 知识 。 数 学 家 已 经 工作 了 几 百 年 试图 证 明 或 者 证 伪 哥 德 巴赫 猜想 ， 
一 群 贪得无厌 的 软件 工程 师 构建 出 一 个 Ruby 程序 ， 奇 迹 般 地 不 止 解决 这 个 问题 ， 还 能 解 
决 可 以 表达 成 循环 程序 的 任何 未 解数 学 猜想 是 不 可 能 的 。 


2. 根本 就 不 可 能 

到 目前 为 止 我 们 已 经 看 到 了 很 强 的 证 据 表 明 停 机 问题 是 不 可 判定 的 ， 但 还 没有 看 到 确定 性 
的 证 明 。 我 们 的 直觉 可 能 是 只 通过 把 哥 德 巴赫 猜想 转 成 一 个 程序 就 证 明 或 者 推翻 它 是 不 可 
能 的 ， 但 计算 有 时 候 是 非常 违背 直觉 的 ， 因 此 我 们 不 应 该 被 多 么 不 可 能 的 东西 说 服 。 如 果 
停机 问题 确实 是 不 可 判定 的 ， 而 不 是 简单 的 难以 判定 ， 我 们 应 该 能 够 证 明 它 。 

































































下 面 是 为 什么 #halts? 永远 不 能 工作 。 如 果 它 工作 ， 我 们 就 能 构建 一 个 新 的 方法 #halts_ 
on_itself?， 这 个 方法 调用 #halts? 以 决定 一 个 程序 在 把 它 自己 的 源 代码 作为 输入 运行 时 
会 做 什么 : ” 


7 














def halts on itself?(program) 
halts? (program, program) 
end 




















就 像 #halts? 一 样 ，#halts_on_itself? 方法 总 会 结束 并 返回 一 个 布尔 值 : 如 果 program 以 
自己 作为 输入 时 能 停机 就 是 true， 如 果 永 远 循 环 就 是 false。 























给 定 #halts? 和 #halts on itself? 的 实现 ， 我 们 可 以 写 一 个 叫 作 do_the_opposite.rb 的 程序 : 


def halts?(program, input) 














# 解析 程序 

# 分 析 程 序 

# 如 果 程 序 在 输入 上 停机 ， 就 返回 true， 否 则 返回 false 
end 





def halts on itself?(program) 
halts? (program, program) 
end 


program = $stdin.read 


if halts on itself?(program) 
while true 


























注 13: 费 伯 出 版 社 的 奖金 在 2002 年 过 期 了 ,但 今天 任何 能 给 出 证 明 的 人 仍然 将 在 明星 数学 家 圈子 中 名 利 双 收 。 


注 14: 这 是 对 8.1.4 节 中 #evaluate_ on_itself 的 重 现 ， 只 是 用 #halts? 替换 了 #evaluate。 
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# 什么 也 不 做 
end 
end 


这 段 代 码 从 标准 输入 中 读 取 program， 查 明 如 果 自 身 为 输入 时 它 是 否 会 停机 ， 并 立即 做 相 
反 的 动作 : 如 果 program 能 停机 ，do_the_opposite.rb 永远 会 循环 ， 如 果 program 永远 循环 ， 
do_the_opposite.rb 会 停机 。 




















现在 ，ruby do_the_opposite.rb < do_the_opposite.rb 会 做 些 什 么 呢 ? “就 像 我 们 之 前 用 
does_it_say_no.rb 看 到 的 那样 ， 这 个 问题 创造 了 不 可 避免 的 矛盾 。 





在 给 定 do_the_opposite.rb 的 源码 作为 参数 时 ,方法 #halts_on_itself? 要 么 返回 true 要 
么 返回 false。 如 果 它 用 返回 true 表示 停机 程序 ， 那 么 ruby do_the_opposite.rb < do_the 
opposite.rb 将 会 永远 循环 下 去 ， 这 意味 着 #halts_on_itself 是 错误 的 。 另 一 方面 ， 如 果 
#halts_on_itself? 返回 false，make do_the_opposite.rb 会 立刻 停机 ， 又 一 次 与 #halts_ 
on_itself? 的 预测 矛盾 。 





























这 里 错 在 选择 #halts_on_itself? 一 一 它 只 是 一 个 无 率 的 小 程序 ， 作 为 #halts 的 代码 并 依 
赖 它 的 答案 。 我 们 真正 展示 的 是 在 用 do_the_opposite.rb 既 作 为 program 又 作为 input 的 参 
数 时 ，#halts? 不 能 返回 一 个 满意 的 答案 ;不 管 如 何 努 力 工作 ， 它 产生 的 任何 结果 都 是 错 
的 。 那 意味 着 对 于 #halts?， 任 何 真正 的 实现 只 存在 两 种 可 能 的 命运 : 














。 给 出 错误 的 答案 ， 如 即使 do_the_opposite.rb 能 停机 也 预测 它 永 远 循环 下 去 〈( 反 过 来 也 
是 这 样 ) ; 

。 永远 循环 而 且 从 来 也 不 会 返回 任何 答案 ， 就 像 ruby does_it_say_no.rb < does_it_say_norb 
里 #evaluate 做 的 那样 。 








因此 一 个 #halts? 完全 正确 的 实现 永远 不 会 存在 : 对 于 输入 ， 它 要 么 做 出 错误 的 预测 ， 要 
么 根本 就 做 不 出 预测 。 











回忆 一 下 可 判定 性 的 定义 : 





一 个 判定 问题 如 果 存 在 一 个 算法 能 保证 对 于 任何 可 能 的 输入 都 能 在 有 限时 间 内 
解决 ， 这 个 问题 就 是 可 判定 的 。 


我 们 应 该 证 明了 写 一 个 Ruby 程序 完全 解决 停机 问题 是 不 可 能 的 ， 而 且 既 然 Ruby 程序 与 图 
灵机 等 价 ， 所 以 图 灵机 也 是 不 可 能 的 。 印 奇 一 图 灵 论 题 说 的 是 所 有 的 算法 都 能 由 一 台 图 灵 
机 执行 ， 因 此 如 果 不 存在 能 解决 停机 问题 的 图 灵机 ， 也 不 会 存在 算法 ， 换 句 话 说， 停机 问 
题 是 不 可 判定 的 。 


















































注 15: 或 者 等 价 地 说 : 如 果 我 们 用 do_the_opposite.rb 的 源 代码 作为 它 的 参数 调用 它 ，#halts_on_itself? 会 
返回 什么 呢 ? 
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8.4 其 他 不 可 判定 的 问题 


能 轻松 定义 的 问题 ， 计 算 机 却 无 法 解决 ， 真 令 人 诅 形 。 但 是 ， 这 个 特定 的 问题 相当 抽象 ， 
而 且 我 们 用 来 描绘 它 的 do_the_opposite.rb 程序 也 不 实际 而 且 做 作 。 我 们 想 要 #halts? 实际 执 
行 ， 或 者 作为 一 个 现实 世界 应 用 的 一 部 分 写 一 个 do_the_opposite.rb 的 程序 看 起 来 不 太 可 能 。 
或 许 我 们 可 以 无 视 不 可 判定 性 ， 将 其 作为 一 个 学 术 “ 玩 具 ”， 然 后 继续 我 们 的 生活 。 

遗憾 的 是 ， 没 那么 简单 ， 因 为 停机 问题 不 是 唯一 的 不 可 判定 问题 。 我 们 日 常 构建 软件 的 过 
程 中 可 能 想 要 解决 大 量 问题 ， 而 它们 的 不 可 判定 性 对 于 自动 化 工具 和 过 程 的 实际 限制 非常 
重要 。 











让 








来 看 个 小 例子 。 假 设 我 们 已 经 接受 了 一 个 任务 ， 要 开发 一 个 输出 “hello world 的 Ruby 程 
序 。 听 起 来 相当 简单 ， 但 按照 长 期 以 来 的 固有 模式 ， 我 们 “还 要 开发 一 个 自动 化 工具 ， 它 
能 可 靠 地 判定 是 否 存 在 一 个 特定 的 程序 在 提供 一 个 特定 的 输入 时 能 输出 hello world。” 有 
了 这 个 工具 ， 我 们 可 以 分 析 最 终 的 程序 ， 然 后 检查 它 是 否 做 了 应 该 做 的 事情 。 









































现在 ， 假 设 我 们 成 功 开发 了 一 个 方法 #prints_hello_wor1d?， 它 能 正确 地 对 所 有 程序 做 出 
判断 。 忽 略 掉 实现 细 市 ， 方 法 会 是 这 种 普遍 的 形式 .: 











def prints hello world?(program, input) 
# 解析 程序 
# 分 析 程 序 
# 如 果 程 序 打印 "hello world"， 就 返回 true， 否 则 返回 false 
end 














写 完 最 初 的 程序 之 后 ， 我 们 可 以 使 用 #prints_hello_world? 来 验证 它 做 了 正确 的 事情 ， 如 
果 做 得 对 ， 就 把 它 签 入 到 源 代码 里 ， 发 邮件 给 老板 ， 然 后 所 有 人 都 会 很 高 兴 。 但 情况 其 至 
更 好 ， 因 为 还 能 使 用 #prints_hello_world? 实现 另 一 个 有 趣 的 方法 ; 




















def halts?(program, input) 
hello world program = %0{ 
program = #{program.inspect} 
input = $stdin.read 
evaluate(program, input) # evaluate program, ignoring its output 
print 'hello world 
} 


prints hello world?(hello world program, input) 
end 





注 16: 当然 是 “负责 任 的 软件 工程 专业 人 员 ”。 
注 17: 如 果 程序 没有 实际 从 $stdin 读 取 任何 东西 ， 输 入 可 能 是 无 关 的 ， 但 为 了 完整 性 和 一 致 性 我 们 会 把 它 
包含 进来 。 
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相 
%Q 语法 引用 字符 串 的 方式 与 %q 一 样 ， 之 后 会 执行 替换 ， 因 此 #{program. 
心 。 inspect} 会 被 一 个 包含 program 值 的 Ruby 字符 串 赫 换 掉 。 


， 
4 人， 














我 们 新 版 本 的 井 alts? 通过 构建 一 个 特殊 的 程序 nello_world_program 来 工作 ， 它 主要 干 两 
件 事情 : 


(1) 用 标准 输入 中 的 input 为 参数 对 program 求 值 ; 
(2) 输出 hello world。 


hello_world_progran 此 时 执行 只 有 两 种 可 能 的 结果 : 要 么 evaluate(program，input) 成 功 
结束 ， 在 这 种 情况 下 hello world 将 会 被 输出 ， 要 么 evaluate(program，input) 将 会 永远 
循环 ， 也 就 根本 没有 输出 。 

把 这 个 程序 提供 给 #prints_hello world?， 以 查 明 那 两 个 结果 中 哪个 将 会 发 生 。 如 果 
#prints_hello world? 返回 true， 那 意味 着 evaluate(program，input) 最 终 将 结束 ， 并 允许 
hello world 输出 ， 因 此 #halts? 返回 true 以 标识 这 个 程序 对 于 input 会 停机 。 相 反 ， 如 果 
#prints_hello world? 返回 false， 那 一 定 是 因为 hello_world_program 永远 也 无 法 到 达 它 的 
最 后 一 行 ， 因 此 #halts 返回 false， 以 此 来 说 明 evaluate(program，input) 会 永远 循环 。 


我 们 对 #halts? 的 新 实现 表明 停机 问题 可 以 规约 成 检查 一 个 程序 是 否 会 输出 hello world 
的 问题 。 换 句 话 说， 任何 计算 #prints_hello_world? 的 算法 都 能 改 成 计算 #halts? 的 算法 。 


我 们 已 经 知道 一 个 可 工作 的 #halts? 不 可 能 存在 ， 因 此 明显 的 结论 是 #prints_hello_ 
world? 的 完整 实现 也 不 可 能 存在 。 如 果 不 可 能 实现 ， 印 奇 一 图 灵 论 题 表明 不 存在 这 样 的 算 
法 ， 因 此 “这 个 程序 是 否 会 输出 hello world ? ”是 另 一 个 不 可 判定 的 问题 。 


在 现实 中 ， 没 有 人 关心 自动 检查 一 个 程序 是 否 会 输出 特定 的 字符 串 ， 但 这 个 不 可 判定 性 证 
明 的 结构 指向 了 某 种 更 大 更 普遍 的 情况 。 我 们 需要 构建 一 个 程序 ， 只 要 其 他 某 个 程序 停机 
了 ， 它 就 展示 “print hello world” 属 性 (输出 hello world) ， 这 对 展示 不 可 判定 性 足够 了 。 
无 法 重用 这 种 方法 的 所 有 程序 行为 的 属性 中 ， 有 我 们 确实 关心 的 属性 吗 ? 

没有 。 这 是 Rice 定理 : 程序 行为 的 任何 非 平 几 性 质 都 是 不 可 判定 的 ， 因 为 停机 问题 总 是 能 
被 规约 成 判定 这 个 属性 是 否 为 true 的 问题 ， 如 果 我 们 能 发 明 一 个 算法 来 判定 那个 属性 ， 就 
能 使 用 它 来 构建 另 一 个 算法 来 判定 停机 问题 ， 而 这 是 不 可 能 的 。 

















































































































概括 地 讲 ， 一 个 “ 非 平 几 的 属性 ”是 对 程序 做 什么 而 不 是 程序 怎么 做 的 一 

心 。 个 要 求 。 例 如 ，Rice 定理 对 于 像 “ 这 个 程序 的 源 代码 包含 字符 串 'reverse' 

全 吗 ? ”这样 的 问题 并 不 适用 ， 因 为 这 是 一 个 实现 细节 ， 能 在 不 改变 程序 外 部 

可 视 行为 的 前 提 下 重 构 掉 。 换 句 话 说， 像 “ 这 个 程序 是 输出 它 输 入 的 逆向 
吗 ? ”这 样 的 语义 性 质 是 在 Rice 定理 范围 内 的 ， 从 而 是 不 可 判定 的 。 


























Rice 定理 告诉 我 们 存在 大 量 关 于 一 个 程序 执行 时 会 干什么 的 不 可 判定 的 问题 。 
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8.5 令 人 肖 形 的 暗示 
不 可 判定 性 是 生命 中 麻烦 的 一 个 事实 。 停 机 问题 令 人 失望 ， 因 为 它 表 明 我 们 无 法 拥有 一 
切 : 我 们 想 要 的 是 能 力 不 受 限制 的 通用 编程 语言 ， 但 还 想 要 写 出 程序 产生 一 个 不 会 陷入 无 
限 循环 的 结果 ， 或 者 至 少 是 子 例 程 作 为 某 个 更 大 的 长 期 运行 任务 的 一 部 分 能 停机 (参见 
8.1.4 节 “ 超 长 时 间 运 行 的 计算 ”部 分 )。 
2004 年 的 一 篇 经 典 论文 对 此 做 出 了 简要 总 结 ; 
由 于 停机 问题 ， 语 言 设 计 中 存在 着 二 分 法 。 根 据 编程 规范 ， 我 们 必须 在 这 两 者 间 
选择 。 








A. 安全 一 一 在 这 种 语言 中 所 有 知道 的 程序 都 要 终止 。 
B. 善 遍 性 一 一 在 这 种 语言 中 ， 我 们 可 以 写 : 


i 所 有 结束 的 程序 ; 

ii. 不 能 结束 的 病态 程序 。 

并 且 ， 给 出 一 个 任意 的 程序 ， 我 们 一 般 无 法 说 出 它 是 (i) 还 是 (ii)。 
50 年 前 ， 在 电子 计算 发 展 初 期 ， 我 们 选择 (B)。 





David Turner，Total Functional Programming (完全 蚁 数 式 编程 ， 


http://www.jucs.org/jucs_10_7/total_functional_programming) 


是 的 ， 我 们 不 愿意 写 出 病态 的 程序 来 ， 但 那 仅仅 是 运气 不 好 。 设 法 识别 任意 的 一 个 程序 是 
否 病态 ， 因 此 我 们 不 可 能 在 不 牺牲 通用 性 的 前 提 下 完全 避免 写 出 病态 程序 。” 


Rice 定理 的 暗示 也 是 令 人 诅 形 的 : 不 止 “ 程 序 是 否 会 停机 ”这 个 问题 是 不 可 判定 的 ，“ 程 
序 是 否 做 了 我 想 让 它 做 的 ”也 是 不 可 判定 的 。 我 们 生活 的 宇宙 当中 ， 设 法 构建 一 台 机 器 有 
准确 预测 一 个 程序 是 否 能 输出 nello world， 是 否 会 计算 一 个 特定 的 数学 函数 或 者 是 否 色 
做 一 个 特定 的 操作 系统 调用 ， 而 这 就 是 它 的 运行 方式 。 


那 是 令 人 诅 形 的 ， 因 为 能 够 机 械 地 检查 程序 性 质 实在 是 非常 有 用 的 ， 有 了 一 个 工具 能 判定 
程序 是 否 遵 守 它 的 规范 或 者 含有 任何 的 bug 之 后 ， 现 代 软 件 的 可 靠 性 将 会 提高 。 那 些 性 质 
可 能 对 于 个 体 程序 是 可 以 机 械 地 检查 出 来 的 ， 但 除非 它们 通常 都 能 检查 出 来 ， 不 然 我 们 将 
永远 不 能 信任 机 器 来 做 这 些 工 作 。 


例如 ， 假 如 我 们 发 明了 一 个 新 的 软件 平台 ， 并 且 决 定 通过 在 线 商店 一 一 个 “应 用 程序 的 
超市 ” 卖 兼容 程序 来 赚钱 ， 如 果 你 喜欢 一 代表 我 们 平台 的 第 三 方 开发 者 。 我 们 想 要 顾客 
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注 18: 完全 编程 语言 是 对 这 个 问题 的 潜在 解决 方案 ,但 到 目前 为 止 它们 还 没有 开始 应 用 ,或 许 是 因为 它们 
比 起 通常 的 语言 更 难 理解 吧 。 
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能 充满 自信 地 购物 ， 因 此 决定 只 买 满足 某 些 条 件 的 程序 : 它们 一 定 不 能 崩溃 ， 它 们 一 定 不 
能 调用 私有 的 API， 并 且 它 们 一 定 不 能 执行 从 网 上 下 载 的 任意 代码 。 


成 千 上 万 的 开发 者 开始 向 我 们 提交 代码 的 时 候 ， 我 们 如 何 检查 每 一 个 应 用 是 否 满足 要 求 
呢 ? 如 果 我 们 使 用 自动 系统 检查 每 一 个 提交 的 规范 程度 ， 那 将 会 节约 大 量 的 时 间 和 金钱 ， 
但 感谢 不 可 判定 性 ， 不 可 能 构建 一 个 准确 完成 这 个 任务 的 系统 。 我 们 只 能 雇用 一 小 了 从 人 运 
行 这 些 程序 、 反 编译 并 且 检 测 操 作 系 统 来 测量 程序 的 动态 行为 ， 除 此 之 外 别 无 他 法 。 


人 工 检查 速度 慢 ， 成 本 高 ， 容 易 出 错 ， 而 且 每 个 程序 只 能 运行 一 小 段 时 间 ， 提 供 自 己 动态 
行为 的 有 限 片段 。 因 此 即使 没 人 犯错 误 ， 通 常 一 些 不 可 预计 的 东西 也 会 出 现 ， 然 后 我 们 就 
会 有 大 量 气 惯 的 顾客 。 多 谢 了， 不 可 判定 性 。 


在 所 有 这 些 不 便 之 下 有 两 个 基础 问题 。 第 一 个 是 我 们 没有 能 力 预测 程序 执行 的 时 候 会 发 生 
什么 ， 弄 清楚 一 个 程序 做 什么 的 唯一 通用 方法 就 是 真正 运行 它 。 尽 管 一 些 程序 足够 简单 ， 
行为 直接 是 可 预测 的 ， 但 仅仅 通过 分 析 它 们 的 源 代 码 ， 通 用 语言 总 是 会 允许 行为 不 可 预测 
的 程序 存在 。” 


第 二 个 问题 是 ， 在 我 们 确实 决定 运行 程序 的 时 候 ， 设 有 可 靠 的 方式 知道 它 多 入 能 运行 完 。 
唯一 通用 的 解决 方案 是 运行 程序 然后 等 它 执行 ， 但 既然 我 们 知道 通用 语言 的 程序 有 可 能 不 
停机 永远 循环 下 去 ， 那 么 总 是 存在 一 些 程序 无 论 等 待 多 和 久 都 运行 不 完 。 


8.6 发 生 上 述 情 况 的 原因 


在 这 一 章 里 ， 我 们 已 经 看 到 所 有 通用 系统 都 足够 强大 ， 可 以 引用 自身 。 程 序 对 数字 进行 运 
算 ， 数字 可 以 表示 字符 串 ， 而 一 个 程序 的 指令 只 用 字符 串 写 下 来 的 ， 因 此 程序 完全 能 够 对 
它们 自己 的 源 代码 进行 运算 。 

自 引 用 能 力 使 得 写 出 能 准确 预测 程序 行为 的 程序 成 为 不 可 能 的 事情 。 一 旦 一 个 特别 的 行为 
检查 程序 写 完 了 ， 我 们 总 是 能 构建 一 个 更 大 的 程序 打败 它 : 新 程序 把 这 个 检测 器 当 作 一 个 
子 例 程 ， 检 查 它 自身 的 源 代 码 ， 然 后 立即 做 与 检测 器 要 做 的 相反 的 事情 。 这 些 自我 矛盾 的 
程序 比 我 们 实际 写 出 来 的 一 些 东 西 更 奇特 ， 但 它们 只 是 一 个 征兆 ， 而 不 是 弟 在 问题 的 根 
因 : 通常 ， 程序 行 为 过 于 强大 而 无 法 准确 预测 。 

























































































y 3 
Ss 人 类 语言 有 类 似 的 能 力 和 问题 。 "这 个 句子 是 一 个 谎言 ”( 说 谎 者 悖 论 ) 是 
心 。 一 句 话 ， 它 不 可 能 是 true 也 不 可 能 是 false 的 ， 就 像 我 们 在 8.1.5 市 中 看 到 

全 的， 任何 计算 机 程序 都 可 以 在 不 需要 任何 特别 语言 特性 的 情况 下 引用 自身 。 




















注 19: Stephen Wolfram 为 这 种 不 运行 程序 就 无 法 预测 程序 行为 的 思想 起 名 叫 计算 不 可 约 。 
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一 言 以 项 之 ,程序 行为 这 么 难 预 测 有 两 个 原因 。 


(1) 任何 拥有 足够 能 力 引 用 自身 的 系统 ， 都 无 法 正确 回答 每 一 个 关于 自身 的 问题 ”。 我 们 
总 是 可 以 构建 一 个 像 do_the_opposite.rb 的 程序 ， 系 统 无 法 预测 它 的 行为 。 为 了 避免 这 个 问 
题 ， 我 们 需要 跳出 自 引 用 系统 使 用 一 个 不 同 的 更 强大 的 系统 回答 关于 它 的 问题 。 




















(2) 但 是 对 于 通用 编程 语言 ， 不 存在 更 强大 的 系统 供 我 们 升级 。 印 奇 -图 灵 论 题 表 明 我 们 
发 明 的 对 程序 行为 进行 预测 的 任何 可 用 算法 ， 都 能 由 一 个 程序 执行 ， 因 此 我 们 无 法 超越 通 
用 系统 的 能 


8.7 ”处 理 不 可 计算 性 


写 一 个 程序 的 所 有 要 点 就 是 让 计算 机 做 有 用 的 寻 
测 程序 是 否 正确 工作 这 个 事实 呢 ? 
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。 作 为 程序 员 ， 我 们 该 如 何 应 对 无 法 检 


拒绝 是 一 个 吸引 人 的 选择 : 忽略 整个 问题 。 如 果 能 自动 校 验 程序 行为 当然 好 ， 但 我 们 不 能 ， 
所 以 只 是 期 望 做 到 最 好 ， 而 永远 不 要 检查 一 个 程序 在 正确 地 完成 它 的 工作 。 


但 这 属于 反应 过 度 ， 因 为 情况 没有 听 起 来 那么 坏 。Rice 定理 并 不 意味 着 分 析 程 序 不 可 能 ， 
而 只 是 我 们 不 可 能 写 出 一 个 不 平凡 的 总 是 停机 并 产生 正确 答案 的 分 析 器 。 就 像 我 们 在 8.3.1 
节 看 到 的 ， 没 有 什么 可 以 阻止 我 们 写 一 个 工具 来 为 某 些 程序 给 出 正确 答案 ， 只 是 我 们 得 承 
认 总 是 会 存在 其 他 程序 要 么 给 出 错误 答案 要 么 永远 循环 不 返回 任何 东西 。 


























不 考虑 不 可 判定 性 ， 下 面 是 一 些 分 析 和 预测 程序 行为 的 实用 方法 。 


。 问 一 些 不 可 判定 的 问题 ， 但 如 果 找 不 到 答案 就 放弃 。 例 如 ， 为 了 检查 一 个 程序 是 否 会 输 
出 特定 的 字符 串 ， 我 们 可 以 运行 程序 然后 等 待 ， 如 果 在 特定 的 时 间 (比如 10 秒 ) 内 没 
有 输出 那个 字符 串 ， 我 们 就 结束 程序 并 假设 它 没有 用 。 我 们 有 可 能 会 扔 掉 一 个 11 秒 之 
后 才 产 生 期 望 输 出 的 程序 ， 但 在 很 多 情况 下 ， 这 种 风险 是 可 以 接受 的 ， 特 别 是 从 自身 来 
说 我 们 不 需要 运行 缓慢 的 程序 。 

。 把 所 问 的 几 个 小 问题 答案 汇总 起 来 ， 就 能 为 一 个 更 大 的 问题 提供 经 验 性 的 证 据 。 在 
执行 自动 化 验收 测试 时 ， 我 们 通常 不 能 为 每 一 个 可 能 的 输入 检查 程序 是 否 做 了 正确 
的 事情 ， 但 我 们 可 以 尝试 为 有 限 的 输入 样本 运行 这 个 程序 来 看 会 发 生 什 么 。 每 一 个 
测试 运行 都 对 那个 特例 程序 如 何 运 行 给 出 了 信息 ， 并 且 我 们 可 以 使 用 这 个 信息 提高 
对 程序 通常 可 能 行为 的 信心 。 有 可 能 还 有 未 测试 的 输入 ， 这 会 引起 完全 不 同 的 行 
为 ， 但 只 要 测试 用 例 为 大 多 数 现实 输入 的 表示 完成 了 工作 ， 我 们 就 可 以 坦然 生活 。 
这 个 方法 的 男 一 个 例子 是 单元 测试 的 使 用 ， 单 元 测试 是 为 了 验证 小 段 程序 行为 ， 而 不 是 















































注 20: 这 大 致 就 是 哥 德 尔 第 一 不 完备 定理 (http://en.wikipedia.org/wiki/G%C3%B6del%27s_incompleteness_ 
theorems 内 容 。 
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把 程序 作为 整体 来 验证 。 一 个 良好 分 离 的 单元 测试 专注 于 简单 单元 代码 的 性 质 ， 并 通过 
把 程序 的 其 他 部 分 表示 成 测试 蔡 代 物 (存根 和 模拟 对 象 ) 来 做 出 假设 。 使 用 小 段 容 易 理 
解 代码 的 单个 单元 测试 可 能 会 简单 而 且 快速 ， 把 任何 一 个 将 会 永远 运行 或 者 给 出 误导 答 
案 的 测试 风险 最 小 化 。 
































通过 这 种 方式 对 程序 的 所 有 片段 进行 单元 测试 ， 我 们 可 以 建立 一 个 类 似 数 学 证 明 的 假 
设 和 影响 链 :“ 如 果 片 段 A 工作 ， 那 么 片段 B 能 工作 ， 而 如 果 片 段 B 工作 ， 那 么 片段 C 
能 工作 。” 判定 所 有 这 些 假设 是 否 正当 是 人 类 推理 的 责任 而 不 是 自动 化 校 验 的 责任 。 当 
然 ， 集 成 和 验收 测试 可 以 提高 我 们 对 整个 系统 做 应 做 之 事 的 自信 。 














问 可 判定 的 问题 ， 在 必要 的 时 候 要 保守 一 些 。 上 面 的 建议 通过 实际 运行 一 个 程序 的 很 多 
部 分 来 看 发 生 了 什么 ， 它 总 是 会 引入 无 限 循环 的 风险 ， 但 有 的 问题 可 以 只 通过 静态 检查 
源 代码 就 能 回答 。 最 明显 的 例子 是 :“ 这 个 程序 含有 任何 的 语法 错误 吗 ?”” 但 万 一 真正 
的 答案 是 不 可 判定 的 ， 我 们 也 准备 接受 近似 安全 的 话 ， 就 可 以 回答 更 有 意思 的 问题 。 

















一 个 常规 分 析 就 是 浏览 程序 的 源 代 码 看 它 是 否 含 有 计算 出 来 的 值 从 来 不 用 的 死 代码 
(dead code) ， 或 者 含有 从 来 不 会 被 求 值 的 不 可 达 代 码 (unreachable code) 。 我 们 不 可 能 
总 能 说 出 是 否 代 码 是 真正 的 死 代 码 或 者 不 可 达 代 码 ， 因 此 只 能 保守 一 些 ， 假 设 它 不 是 ， 
但 存在 明显 是 的 情况 : 在 某 些 语言 里 ， 我 们 知道 赋值 给 一 个 永远 不 再 使 用 的 局 部 变量 
肯定 是 死 的 ， 一 个 紧 跟 在 return 后 边 的 语句 必 是 不 可 达 的 。” 像 GCC 这 样 优化 的 编译 
器 就 是 使 用 这 个 技术 识别 和 去 除 不 必要 的 代码 ， 让 程序 更 小 更 快 而 且 不 会 影响 程序 的 
行为 。 

通过 把 程序 转换 成 更 简单 的 东西 来 近似 它 ， 然 后 问 关 于 近似 的 可 判定 问题 。 这 个 重要 的 
思想 是 下 一 章 的 主题 。 























E 21; Java 语言 规范 要 求 编译 器 拒绝 任何 含有 不 可 达 代码 的 程序 。 参 见 http://docs.oracle.com/javase/specs/jls/ 
se7/htmJjls-14.html#jls-14.21， 其 中 有 Java 编译 器 如 何不 运行 程序 就 判定 一 个 程序 哪 一 部 分 有 可 能 不 
可 达 的 宛 长 解释 。 
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在 “玩偶 国 中 编程 





编程 就 是 用 语法 与 机 器 交流 思想 。 在 写 程序 的 时 候 ， 我 们 知道 在 程序 执行 的 时 候 我 们 
想 要 机 器 做 什么 ， 而 了 解 编程 语言 的 语义 让 我 们 相信 机 器 将 理解 程序 每 个 细节 的 含义 。 














但 复杂 的 计算 机 程序 远 非 单个 语句 和 表达 式 的 累加 那么 简单 。 一 旦 把 许多 小 零件 组 合 到 一 
起 构成 更 大 的 整体 ， 能 检查 整个 程序 是 否 实际 做 了 我 们 想 要 它 做 的 事 会 很 用。 例如， 我 
们 可 能 想 要 知道 它 总 是 返回 确定 的 结果 ， 或 者 运行 这 个 程序 能 对 文件 系统 或 者 网 络 有 既定 
的 副作用 ,或 者 只 是 不 含有 明显 的 一 遇见 非 期 望 输入 就 会 导致 月 涡 的 bug。 


实际 上 ， 我 们 可 能 想 要 程序 拥有 各 种 各 样 的 属性 ， 而 如 果 能 只 是 检查 一 个 特定 程序 的 语法 
来 看 它 是 否 有 那些 属性 ， 将 是 相当 方便 的 事情 。 但 从 Rice 定理 可 知 ， 通 过 看 源 代码 预测 一 
个 程序 的 行为 不 可 能 总 是 给 出 正确 答案 。 当 然 ， 最 直接 的 查 明 一 个 程序 将 会 做 什么 的 途径 
就 是 执行 它 ， 有 时 候 这 确实 没 问 题 一 一 大 量 的 软件 测试 就 是 通过 基于 已 知 的 输入 运行 再 根 
据 期 望 的 输出 检查 结果 完成 的 一 一 但 有 时 候 运 行 代码 可 能 也 不 是 一 种 可 接受 的 方式 ， 原 因 
如 下 。 























首先 ， 任 何 有 用 的 程序 有 可 能 会 处 理 直 到 运行 时 才 知 道 的 一 些 信 息 : 来 自用 户 的 交互 式 
输入 ， 作 为 参数 传 进来 的 文件 ， 从 网 络 读 取 的 数据 ， 诸 如 此 类 的 东西 。 我 们 当然 可 以 用 
一 些 假 的 输入 运行 程序 以 便 感知 它 能 做 什么 ,但 那 只 会 告诉 我 们 针对 这 些 输入 的 程序 行 
为 ， 而 真正 的 输入 不 一 样 时 会 发 生 什么 呢 ?” 用 输入 的 所 有 组 合 运行 程序 经 常 是 不 实际 或 
者 不 可 能 的 ， 而 用 特定 集合 的 输入 运行 程序 虽然 可 行 ， 却 不 一 定 能 告诉 我 们 有 关 基 行为 
的 多 少 信息 。 
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还 有 一 个 问题 ， 我 们 在 8.1.4 节 已 经 探索 过 了 ， 就 是 用 足够 强大 的 语言 写成 的 程序 可 以 永 
远 运 行 而 从 来 不 会 产生 结果 。 这 让 通过 运行 程序 来 可 靠 地 研究 任意 程序 变 得 不 可 能 ， 因 为 
有 时候 不 可 能 预先 说 出 一 个 程序 是 否 会 无 限 运 行 (参见 8.3 市 )， 因 此 任何 尝试 运行 程序 的 
自动 监测 器 都 面临 永远 得 不 到 答案 的 风险 。 





























最 后 ， 即 使 一 个 程序 不 管 什么 原因 ， 它 事先 所 有 的 输入 数据 都 可 用 ， 而 且 总 是 能 终止 而 不 
会 永远 人 循环， 运行 这 个 程序 的 代价 也 可 能 非常 高 或 者 很 不 方便 。 可 能 会 花 很 长 时 间 才 会 结 
束 ， 或 者 有 不 可 逆转 的 副作用 一 一 发 送 邮 件 、 汇 钱 、 发 射 导弹 一 一 对 于 测试 的 目的 ， 这 些 
都 是 不 应 该 发 生 的 。 








所 有 这 些 原因 让 能 够 不 实际 执行 程序 就 能 发 现 它 的 问题 变 得 很 有 用 。 做 到 这 一 点 的 一 种 方 
式 是 使 用 抽象 解释 ， 这 是 一 种 分 析 技 术 。 使 用 这 种 技术 时 ， 我 们 执行 这 个 程序 的 简化 版 
本 ， 然 后 使 用 执行 结果 推导 出 原始 程序 的 性 质 来 。 


9.1 抽象 解释 


抽象 解释 给 了 我 们 一 种 着 手 处 理 难处 理 问 题 的 方法 ， 这 些 难 处 理 的 问题 或 许 过 于 庞大 ， 过 
于 复杂 ， 或 者 有 太 多 的 未 知 东西 难以 直接 处 理 。 抽 象 解释 的 主要 思想 就 是 使 用 抽象 ， 或 者 
通过 让 它 更 小 ， 更 简单 ， 或 者 通过 去 掉 未 知 的 东西 ， 但 这 样 做 还 能 保留 足够 的 细节 ， 以 便 
让 它 的 解决 方案 与 原始 问题 相关 。 


为 了 让 这 个 模糊 的 想法 更 具体 ， 让 我 们 看 一 个 抽象 解释 的 简单 应 用 。 


9.1.1 路线 规划 

假设 你 是 一 个 身 处 陌生 国家 的 旅行 者 ， 想 要 做 到 另 一 个 镇 的 公路 旅行 计划 。 你 怎么 决定 要 
走 哪 条 路 线 呢 ? 一 个 直接 的 解决 方案 就 是 跳 上 你 租 来 的 汽车 ， 然 后 朝 看 起 来 最 有 希望 到 达 
目的 地 的 方向 行驶 。 取 决 于 你 的 幸运 程度 和 外 国 路 标 对 你 的 帮助 程度 ， 这 种 对 未 知道 路 的 
暴力 探索 可 能 最 终 让 你 到 达 目 的 地 。 但 这 是 一 个 昂贵 的 策略 ， 而 且 很 可 能 在 完全 放弃 之 
前 ， 你 会 越 来 越 迷 路 。 


使 用 地 图 来 规划 你 的 旅行 是 极 理性 的 想法 。 印 在 纸 上 的 公路 地 图 是 牺牲 现实 公路 网 络 大 量 
细节 之 后 的 一 个 抽象 。 它 不 会 告诉 你 交通 是 什么 样 ， 哪 条 公路 当前 关闭 了 ， 某 个 建筑 物 在 
哪儿 ， 或 者 关于 第 三 维 的 任何 东西 。 至 关 重 要 的 是 ， 它 比 真实 的 东西 更 小 更 平 。 但 一 张 地 
图 确实 保留 了 旅行 规划 所 需要 的 最 重要 的 信息 : 所 有 镇 的 相对 位 置 ， 哪 条 路 通 向 哪个 镇 ， 
以 及 哪些 路 彼此 之 间 如 何 连 接 。 


尽管 丢掉 了 一 些 细 市 ， 
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日 一 个 准确 的 地 图 仍然 是 有 用 的 ， 因 为 它 指定 的 路 线 很 可 能 在 现实 














注 1:“ 足 够 强大 ”这 里 意思 是 “通用 的 "， 参 见 8.1.4 市 。 
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中 是 有 效 的 。 地 图 制作 人 员 已 经 完成 了 创建 现实 模型 的 昂贵 工作 ， 这 让 你 能 只 查看 简化 的 
公路 网 络 并 规划 路 线 。 然 后 当 你 驾车 驶 向 目的 地 时 ， 你 可 以 把 计算 的 结果 转换 回 现实 世界 
中 。 按 照 地 图 这 个 抽象 世界 指定 的 路 线 ， 可 以 避免 试 错 的 昂贵 代价 。 


近似 的 地 图 让 行驶 计算 更 容易 ， 又 不 会 损失 结果 的 准确 性 。 在 很 多 情况 下 ， 用 地 图 做 决策 
可 能 会 是 错 的 一 一 无 法 保证 地 图 告诉 你 旅行 需要 的 所 有 信息 一 一 但 预先 规划 路 线 可 以 让 你 
排除 一 些 错 误 ， 让 从 一 个 地 方 到 另 一 个 地 方 容易 控制 得 多 。 


9.1.2 抽象 : 乘法 的 符号 
用 印刷 地 图 规划 路 线 是 抽象 解释 的 现实 应 用 ， 也 非常 随意 。 如 果 要 举 一 个 更 正式 的 例子 ， 
我 们 可 以 看 一 下 数字 的 乘法 。 尽 管 这 仍然 是 个 小 例子 ， 但 乘法 让 我 们 有 机 会 开始 写 代 码 研 


究 这 些 思想 。 


EE 

















已 















































假设 两 个 数 相 乘 是 一 个 困难 或 者 昂贵 的 运算 ， 而 我 们 对 不 实际 执行 乘法 就 查 明 它 结果 的 某 些 
信息 很 感 兴趣 。 特 别 地 : 结果 的 符号 是 什么 ? 它 是 一 个 负数 、 零 ， 还 是 一 个 整数 呢 ? 


理论 上 的 难点 是 在 具体 的 世界 中 进行 计算 ， 使 用 乘法 的 标准 解释 : 真 的 把 数字 乘 起 来 ， 看 
结果 的 数 ， 然 后 决定 结果 是 否 为 负 的 ， 零 ， 或 者 是 正 的 。 例 如 ， 在 Ruby 中 : 


























>>6* -9 
=> -54 


-54 是 负数 ， 所 以 我 们 知道 了 6 和 -9 的 乘积 是 一 个 负数 。 任 务 完成 了 。 

尽管 如 此 ， 通 过 在 抽象 世界 中 进行 计算 ， 使 用 乘法 的 机 象 解释 ， 也 可 能 发 现 同样 的 信息 。 
就 像 一 个 地 图 使 用 平面 纸 上 的 线 来 表示 现实 世界 中 的 道路 一 样 ， 我 们 使 用 抽象 的 值 来 表示 
数字 ;， 我们 可 以 在 地 图 上 设计 一 条 路 线 ， 而 不 必 在 真实 道路 上 通过 试 错 来 找到 路 。 可 以 在 
抽象 值 上 定义 一 个 抽象 的 乘法 运算 ， 而 不 必 使 用 具体 数 之 上 的 具体 乘法 。 

为 此 ， 我 们 需要 设计 抽象 的 值 让 计算 在 结果 仍 为 有 用 答案 的 同时 ， 变 得 更 简单 。 可 以 利用 
两 个 乘 数 的 绝对 值 "不 影响 结果 符号 的 事实 : 












































>> (6 * -9) < 0 

=> true 

>> (1000 * -5) < 0 
=> true 

>> (1 * -1)< 0 
=> true 


小 时 候 ， 我 们 就 知道 关键 要 看 乘 数 的 符号 :两 个 正 数 的 乘积 ， 或 者 两 个 负数 的 乘积 ， 总 是 一 
个 正 数 ， 一 个 正 数 和 一 个 负数 的 乘积 总 是 负数 ， 而 零 与 任何 数 的 乘积 都 是 零 。 








注 2: 一 个 数 的 绝对 值 是 把 符号 去 掉 时 候 的 值 。 例 如 ，-10 的 绝对 值 是 10。 
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因此 使 用 “负数 "“ 零 ”和 “ 正 数 ”作为 抽象 值 ， 可 以 用 Ruby 定义 一 个 Sign 类 然后 创建 











它 的 三 个 实例 : 


Class Sign < Struct.new(:name) 


NEGATIVE, ZERO, POSITIVE = [:negative, :zero, :positivel].map { |name| new(name) } 


def inspect 
"#<Sign #{name}>" 
end 
end 


这 给 了 我 们 可 以 用 作 抽 象 值 的 Ruby 对 象 : Sign: :NEGATIVE 代表 “任何 负数 ”，Sign: :ZERO 
代表 “数字 零 "， 而 Sign: :POSITIVE 代表 “任意 正 数 "。 这 三 个 Sign 对 象 组 成 了 这 个 小 的 
抽象 世界 ， 在 这 个 世界 里 ， 我 们 将 执行 抽象 运算 。 而 与 此 同时 ， 有 具体 的 世界 里 包含 着 事实 


上 无 限 个 Ruby 的 正 数 。; 





我 们 可 以 通过 实现 符号 相关 的 乘法 来 定义 Sign 值 的 抽象 乘法 : 


class Sign 
def *(other sign) 
if [self, other sign].include?(ZERO) 
ZERO 
elsif self == other sign 
POSITIVE 
else 
NEGATIVE 
end 
end 
end 





Sign 的 实例 现在 可 以 像 数字 那样 “ 乘 ”到 一 起 了 ， 并 且 Sign# 的 实现 产生 的 答案 与 实际 





数字 乘法 的 一 致 : 


>> Sign::POSITIVE * Sign::POSITIVE 
=> #<Sign positive> 

>> Sign::NEGATIVE * Sign::ZERO 

=> #<Sign zero> 

>> Sign::POSITIVE * Sign::NEGATIVE 
=> #<Sign negative> 


例如 ， 上 面 的 最 后 一 行 问 的 问题 是 : 我 们 把 任意 的 正 数 乘 以 任意 的 负数 得 到 的 结果 是 什 
么 ? 答案 是 : 一 个 负数 。 这 仍然 是 一 种 乘法 ， 但 比 我 们 习惯 的 那 种 要 简单 ， 它 只 对 几乎 已 
经 去 掉 所 有 识别 信息 的 “数字 ”起 作用 。 如 果 把 真实 的 乘法 想象 成 是 昂贵 的 ， 那 这 个 缩减 

















的 乘法 版 本 就 是 廉价 的 。 





注 3: Ruby 的 Bignum 对 象 可 以 表示 任意 大 小 的 正 数 ， 它 只 受 可 用 内 存 的 限制 。 











A 
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有 了 数字 的 抽象 世界 和 对 这 些 数 字 乘 法 的 抽象 解释 之 后 ， 我 们 可 以 用 不 同 的 方式 处 理 最 初 
的 问题 了 。 我 们 不 是 把 两 个 数字 直接 相 乘 来 找到 它们 结果 的 符号 ， 而 是 把 数字 转换 成 它们 
的 抽象 表示 再 把 它们 相 乘 。 首先， 需要 一 种 把 具体 数 转换 成 抽象 数 的 方法 : 


class Numeric 
def sign 
if self < 0 
Sign: :NEGATIVE 
elsif zero? 
Sign: :ZERO 
else 
Sign: :POSITIVE 
end 
end 
end 


现在 ， 可 以 转换 两 个 数 然后 在 抽象 世界 中 做 乘法 了 : 





>> 6.sign 
=> #<Sign positive> 
>> -9.sign 
=> #<Sign negative> 
>> 6.sign * -9.sign 
=> #<Sign negative> 


我 们 又 计算 出 了 6 * -9 会 得 到 一 个 负数 ， 但 这 次 没 进行 任何 实际 数字 的 乘法 。 步 人 抽象 世 
界 让 我 们 有 了 执行 计算 的 另 一 种 方式 ， 更 重要 的 是 ， 这 个 抽象 结果 能 转换 回 具 体 的 世界 ， 
这 样 就 能 搞 清 它 的 意思 ， 尽 管 抽 象 时 牺牲 细节 只 得 到 了 一 个 近似 的 答案 。 在 这 个 场景 下 ， 
抽象 结果 Sign: :NECGATIVE 表明 任何 具体 的 数 -1、-2、-3 等 都 可 能 是 6 * -9 的 答案 ， 但 答 
案 肯 定 不 是 0 或 者 任何 像 1 或 500 这 样 的 正 数 。 





























注意 ， 因 为 Ruby 的 值 都 是 对 象 ( 带 有 操作 的 数据 结构 )， 所 以 可 以 根据 提供 的 是 具体 的 
(Fixnum) 还 是 抽象 的 (Sign) 对 象 ， 我 们 可 以 使 用 同样 的 Ruby 表达 式 为 参数 执行 具体 或 
抽象 的 计算 。 用 #calculate 方法 把 三 个 数 用 特别 的 方式 乘 起 来 ; 





def calculate(x, y, z) 
(x * y) * (x * z) 
end 
如 果 使 用 Fixnum 对 象 调用 #calculate， 这 个 计算 将 由 Fixnum#* 完成 ， 从 而 得 到 一 个 具体 的 
Fixnum 结果 。 相 反 ， 如 果 我 们 用 Sign 对 象 调用 它 ，Sign#* 操作 将 会 调用 并 生成 一 个 Sign 
结果 。 





>> calculate(3, -5, 0) 

=> 0 

>> calculate(Sign::POSITIVE, Sign::NEGATIVE, Sign::ZERO) 
=> #<Sign zero> 
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这 给 了 我 们 在 真正 的 Ruby 程序 中 执行 抽象 解释 的 有 限 机 会 ， 可 以 把 具体 的 参数 替换 成 它 
们 对 应 的 抽象 相对 物 ， 然 后 无 需 修改 就 可 以 运行 其 他 代码 了 。 








这 个 技术 让 人 联想 到 自动 化 单元 测试 中 打桩 测试 (test doubles) 的 方法 (如 

心 存根 和 模拟 对 象 )。 桩 是 插 到 代码 中 的 一 个 特别 的 占 位 对 象 ， 使 用 这 种 方法 

会 ， 可 以 控制 和 校 验 代码 的 行为 。 在 使 用 更 现实 的 对 象 作为 测试 数据 特别 不 方便 
或 者 特别 昂贵 的 条 件 下 ， 它 们 特别 有 用 。 
































9.1.3 ”安全 和 近似 : 增加 符号 

目前 为 止 可 以 看 到 ， 抽 象 世 界 中 的 计算 比 具体 世界 中 的 对 应 计算 在 准确 性 上 要 差 一 些 ， 因 
为 抽象 会 丢掉 细节 : 在 地 图 上 规划 的 路 线 会 表明 在 哪 条 路 转变， 但 不 会 说 在 哪 条 车 道行 
驶 ， 两 个 Sign 对 象 的 乘法 会 表明 结果 在 零 的 哪 一 边 ， 但 不 会 告知 实际 结果 值 。 

很 多 时 候 ， 结 果 不 准 确 是 没 问 题 的 ， 但 对 一 个 需要 有 用 的 抽象 ， 很 重要 的 是 这 个 不 准确 是 
安全 的 。 安 全 意味 着 这 个 抽象 总 是 能 给 出 真相 : 抽象 计算 的 结果 一 定 要 与 它 对 应 的 具体 结 
果 一 致 。 如 果 不 一 致 ， 抽 象 给 我 们 的 信息 就 不 可 靠 ， 这 可 能 比 无 用 还 要 差 。 

Sign 抽象 是 安全 的 ， 因 为 把 数字 转换 成 sign， 并 把 它们 乘 在 一 起 所 给 出 的 结果 总 是 与 计算 
数字 本 身 然后 把 最 终结 果 转 成 Sign 一 样 : 











>> (6 * -9).sign == (6.sign * -9.sign) 


=> true 
>> (100 * 0).sign == (100.sign * 0.sign) 

=> true 

>> calculate(1, -2, -3).sign == calculate(1.sign, -2.sign, -3.sign) 
=> true 

















在 这 方面 ，Sign 抽象 实际 上 是 非常 准确 的 。 它 准确 保留 了 合适 数量 的 信息 并 通过 抽象 计算 
把 它们 完美 保留 下 来 。 在 抽象 与 想 要 执行 的 计算 不 是 那么 匹配 的 时 候 ， 安 全 性 问题 变 得 更 
重要 了 ， 通 过 抽象 加 法 实验 我 们 将 看 到 这 一 点 。 


两 个 数 的 符号 如 何 确定 它们 加 到 一 起 得 到 的 数字 的 符号 ， 有 一 些 规 则 ， 但 它们 并 不 是 
对 所 有 可 能 的 符号 组 合 都 有 作用 。 我 们 知道 两 个 正 数 的 和 一 定 是 正 数 ， 而 一 个 负数 和 
零 的 和 一 定 是 负数 ， 但 如 果 把 一 个 负数 和 一 个 正 数 加 到 一 起 会 怎么 样 呢 ? 在 这 种 情况 
下 ， 结 果 的 符号 取决 于 两 个 数 绝对 值 的 关系 : 如 果 正 数 的 绝对 值 比 负数 的 绝对 值 大 ， 
我 们 得 到 的 答案 就 是 正 的 (-20+30=10)， 如 果 负 数 的 绝对 值 更 大 ， 那 就 会 得 到 负数 的 
答案 〈-30+20=-10)， 而 如 果 它 们 的 绝对 值 恰好 相等 ， 会 得 到 零 。 但 当然 ， 每 个 数 
的 绝对 值 正好 是 我 们 的 抽象 已 经 丢弃 的 信息 ， 因 此 不 可 能 在 抽象 世界 中 做 出 这 种 符号 
的 判定 。 
























































对 我 们 的 抽象 这 是 一 个 问题 ， 因 为 它 太 抽象 了 ， 不 能 在 每 种 情况 下 都 准确 地 进行 计算 。 如 
何 处 理 这 种 情况 呢 ? 我 们 可 以 添加 抽象 加 法 的 定义 让 它 返 回 同样 的 结果 一 一 比如 说 只 要 不 


























知道 正确 答案 的 时 候 就 返回 Sign: :ZERO_ 但 那 会 不 安全 ， 因 为 那 意味 着 抽象 计算 
答案 可 能 与 通过 具体 计算 得 到 的 答案 不 一 致 。 





维 U 





=- 口 U 





的 


解决 方案 就 是 扩展 抽象 以 适应 这 个 不 确定 性 。 就 像 Sign 值 意思 是 “任何 正 数 ”和 “任何 负 
数 ” 一 样 ， 我 们 可 以 引入 一 个 新 的 ， 它 只 表示 “任何 数 "。 这 实际 上 是 最 实在 的 答案 ,在 
遇 到 问题 但 没有 足够 细 市 的 时 候 我 们 可 以 给 出 这 个 答案 来 : 结果 可 能 是 负数 、 零 ， 或 者 正 























数 ， 不 保证 到 底 是 哪 种 。 让 我 们 管 这 个 新 值 叫 作 Sign: :UNKNONN: 











class Sign 
UNKNOWN = new( :unknown) 
end 


这 给 了 我 们 安全 实现 抽象 加 法 所 需要 的 东西 。 计 算 两 个 数 x 和 y 之 和 的 符号 的 规则 是 : 
。 如 果 x 和 y 符号 相同 〈 同 为 正 、 同 为 负 ， 或 者 都 是 零 ) ， 那 这 个 符号 就 是 它们 和 的 符号 ; 











。 如 果 x 是 零 ， 它 们 的 和 与 y 的 符号 相同 ， 反 过 来 也 是 这 样 ， 
。 否则 ， 它 们 和 的 符号 未 知 。 


很 容易 把 这 些 规则 转换 成 Sign#+: 


class Sign 
def +(other sign) 
if self == other sign || other sign == ZERO 
self 
elsif self == ZERO 
other sign 
else 
UNKNOWN 
end 
end 
end 


这 样 给 出 的 行为 正 是 我 们 想 要 的 : 


>> Sign::POSITIVE + Sign::POSITIVE 
=> #<Sign positive> 

>> Sign::NEGATIVE + Sign::ZERO 

=> #<Sign negative> 

>> Sign::NEGATIVE + Sign::POSITIVE 
=> #<Sign unknown> 








事实 上 ， 在 输入 中 有 一 个 符号 未 知 的 时 候 这 个 实现 恰好 做 了 正确 的 事 


4 
Et 


>> Sign::POSITIVE + Sign: :UNKNOWN 
=> #<Sign unknown> 
>> Sign::UNKNOWN + Sign::ZERO 
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=> #<Sign unknown> 
>> Sign::POSITIVE + Sign::NEGATIVE + Sign::NEGATIVE 
=> #<Sign unknown> 


但 是 我 们 确实 需要 回去 修改 Sign# 的 实现 ， 以 便 它 能 正确 地 处 理 Sign: :UNKNONN: 





class Sign 
def *(other sign) 
if [self, other sign].include?(ZERO) 
ZERO 
elsif [self, other sign].include? (UNKNOWN) 
UNKNOWN 
elsif self == other sign 
POSITIVE 
else 
NEGATIVE 
end 
end 
end 


这 样 我 们 就 有 了 两 个 可 以 使 用 的 抽象 操作 。 注 意 ，Sign: :UNKNOWN 是 不 传染 的 ， 即 使 一 个 
未 知 数 乘 以 零 也 仍然 是 零 ， 因 此 任何 中 间 存 在 的 不 确定 性 都 可 能 在 结束 时 被 消化 掉 : 





>> (Sign: :POSITIVE + Sign::NEGATIVE) * Sign::ZERO + Sign: :POSITIVE 
=> #<Sign positive> 

















为 了 处 理 Sign: :UNKNOWN 引入 的 不 准确 性 ， 我 们 还 需要 调整 对 正确 性 的 认识 。 因 为 抽象 有 
时 候 没 有 足够 的 信息 给 出 准确 答案 ， 一 个 计算 的 抽象 和 具体 版 本 也 不 总 是 能 给 出 互相 准确 
匹配 的 结果 了 : 





>> (10 + 3).sign == (10.sign + 3.sign) 


=> true 

>> (-5 + 0).sign == (-5.sign + 0.sign) 
=> true 

>> (6 + -9).sign == (6.sign + -9.sign) 
=> false 


>> (6 + -9).sign 

=> #<Sign negative> 
>> 6.sign + -9.sign 
=> #<Sign unknown> 





怎么 回 事 呢 ? 抽象 还 安全 吗 ? 是 的 ， 因 为 在 失去 准确 度 返 回 Sign: :UNKNOWN 的 时 候 ， 抽 象 
计算 告诉 我 们 的 仍然 是 某 种 事实 :“ 结 果 是 一 个 负数 、 零 ， 或 者 正 数 。 它 没有 执行 具体 计 
算 所 得 到 的 结果 有 用 ， 但 它 没 错 ， 并 且 它 好 在 没有 往 抽象 值 中 添加 更 多 信息 从 而 让 抽象 计 


算 变 复杂 。 


















































我 们 在 代码 中 可 以 用 一 种 比 析 = 更 好 的 方式 来 比较 符号 ，#= 现 在 太 不 利于 安全 检查 了 。 
这 里 想 要 知道 的 是 : 具体 计算 的 结果 在 抽象 计算 所 预测 的 结果 范围 内 吗 ? 如 有 果 抽象 计算 声 
称 可 能 有 几 个 不 同 的 结果 ， 那 具体 计算 是 实际 产生 了 这 个 结果 中 的 一 个 ， 还 是 完全 是 另外 
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的 结果 呢 ? 


在 Sign 上 定义 一 个 操作 ， 它 可 以 告诉 我 们 两 个 抽象 值 是 否 用 这 种 方式 彼此 关联 。 既 然 我 们 
在 测试 一 个 Sign 的 值 是 否 “ 沙 在 ” 另 一 个 里 ， 那 么 叫 它 六 = 方法 吧 : 














class Sign 
def <=(other sign) 
self == other sign || other sign == UNKNOWN 
end 
end 





这 样 我 们 就 可 以 做 测试 了 : 


>> Sign::POSITIVE <= Sign::POSITIVE 
=> true 
>> Sign::POSITIVE <= Sign: :UNKNOWN 
=> true 
>> Sign::POSITIVE <= Sign::NEGATIVE 
=> false 


现在 可 以 检查 安全 性 了 ， 看 一 下 是 否 每 个 具体 计算 的 结果 都 落 在 了 抽象 计算 预测 的 范 


甲 























>> (6 * -9).sign <= (6.sign * -9.sign) 


=> true 
>> (-5 + 0).sign <= (-5.sign + 0.sign) 
=> true 
>> (6 + -9).sign <= (6.sign + -9.sign) 
=> true 


安全 性 对 包括 加 法 和 乘法 在 内 的 任何 计算 都 能 保持 ， 因 为 当 抽象 计算 无 法 给 出 准确 答案 的 
时 候 ， 我 们 已 经 设计 了 一 个 能 进行 安全 近似 的 抽象 。 

顺便 说 一 下 ， 能 访问 这 个 抽象 让 我 们 能 对 进行 数 的 加 和 乘 的 Ruby 代码 做 简单 的 分 析 。 作 
为 一 个 实例 ， 下 面 是 一 个 计算 平方 和 的 方法 : 





def sum of squares(x, y) 
(x * x) + (y* y) 
end 











如 果 想 要 自动 分 析 这 个 方法 以 了 解 它 的 某 些 行为 ， 我 们 可 以 把 它 处 理 成 黑 盒 ， 用 所 有 可 
能 的 参数 运行 它 ， 这 可 能 会 造成 永久 运行 ， 也 可 以 检查 它 的 源 代码 并 尝试 使 用 数学 推理 
来 推导 出 它 的 属性 ， 这 样 很 复杂 。( 而 在 一 般 情 况 下 ， 由 于 Rice 定理 这 注定 失败 。) 抽象 
解释 给 了 我 们 第 三 个 选项 ， 可 以 用 抽象 值 调用 这 个 方法 ， 看 这 个 计算 的 抽象 版 本 会 产生 
什么 输出 ， 因 为 抽象 值 的 组 合 数 只 是 一 个 很 小 的 数字 ， 所 以 为 所 有 的 可 能 输入 这 么 做 也 
是 可 行 的 。 


每 个 参数 x 和 y 都 可 能 是 负数 、 零 或 者 正 数 ， 因 此 让 我 们 看 看 输出 都 有 哪些 可 能 : 
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>> inputs = Sign::NEGATIVE, Sign::ZERO, Sign::POSITIVE 

=> [#<Sign negative>, #<Sign zero>, #<Sign positive>] 

>> outputs = inputs.product(inputs).map { |x, y| sum of squares(x, y) } 

=> |[ 
#<Sign positive>, #<Sign positive>, #<Sign positive>, 
#<Sign positive>, #<Sign zero>, #<Sign positive>, 
#<Sign positive>, #<Sign positive>, #<Sign positive> 

] 
>> outputs .uniq 
=> [#<Sign positive>, #<Sign zero>] 








不 必 经 过 任何 智能 分 析 ， 这 就 能 告诉 我 们 #sum_of_squares 只 能 产生 零 或 者 正 数 ， 从 来 不 
会 有 负数 一 一 对 于 读 过 代码 的 人 来 说 ， 这 是 一 个 相当 无 聊 的 特性 ， 但 对 机 器 来 说 ， 这 都 无 
所 谓 。 当 然 ， 这 种 小 技巧 只 对 非常 简单 的 代码 起 作用 ， 但 尽管 是 个 小 玩具 ， 它 还 是 展示 了 
抽象 如 何 能 让 一 个 难题 变 得 更 容易 处 理 。 


9.2 静态 语义 


到 目前 为 止 ， 我 们 已 经 看 到 了 如 何不 实际 执行 计算 就 能 发 现 它 的 近似 信息 。 我 们 本 可 以 通 
过 实际 执行 计算 来 获得 更 多 信息 ， 但 近似 的 信息 比 没有 还 是 要 强 ， 而 且 对 于 某 些 程序 〈 如 
路 线 规划 ) ， 可 能 这 就 是 我 们 所 需要 的 全 部 了 。 


在 乘法 和 加 法 的 例子 里 ， 我 们 通过 把 输入 的 具体 数 换 成 抽象 值 ， 把 一 个 小 程序 转 成 了 一 个 
更 简单 更 抽象 的 版 本 ， 但 如 果 想 要 研究 更 大 更 复杂 的 程序 ， 用 这 种 技术 只 能 到 这 个 程度 了 。 
提供 给 它们 自己 乘法 和 加 法 实现 的 值 很 容易 创建 ， 但 更 一 般 的 情况 下 ，Ruby 并 不 允许 值 控 
制 它 们 自身 的 行为 (例如 在 if 语句 中 使 用 它们 的 时 候 )， 因 为 它 对 特定 的 语法 片段 如 何 工 
作 有 硬 编码 的 规则 “。 除 此 之 外 ， 仍 然 存在 的 问题 是 ， 因 为 一 些 程序 会 永远 循环 而 不 会 返回 
结果 ， 所 以 通常 情况 下 通过 运行 程序 并 等 待 其 输出 来 了 解 程序 并 不 可 行 。 


乘法 和 加 法 的 例子 还 有 另 一 个 缺点 ， 那 就 是 它们 没什么 意思 ， 没 有 人 会 关注 它们 的 程序 返 
回 正 数 或 者 负数 。 在 实践 中 ， 有 意思 的 是 像 “我 的 程序 运行 时 会 崩溃 吗 ? ”和 “我 的 程序 


能 变 得 更 有 效率 吗 ? ”这 类 问题 。 


我 们 可 以 通过 思考 它们 的 静态 语义 来 回答 关于 程序 的 更 有 趣 的 问题 。 在 第 2 章 ， 我 们 了 解 
了 编程 语言 的 动态 语义 ， 一 种 定义 代码 运行 时 含义 的 方法 。 一 种 语言 的 静态 语义 告诉 我 们 
程序 性 质 ， 无 需 执行 就 可 以 研究 。 静 态 语 义 的 经 典 例子 就 是 类 型 系统 : 它 是 一 个 能 用 来 分 
析 程 序 的 规则 集合 ， 能 检查 其 中 是 否 含有 某 种 bug。 在 2.3.1 市 的 “正确 性 ”里 ， 我 们 考 
虑 的 是 像 <x=true; x=x+1» 这 样 的 Simple 程序 ， 它 在 语法 上 有 效 但 执行 时 会 引起 动态 语 
义 的 问题 。 一 个 类 型 系统 可 以 事先 预 判 这 些 错误 ， 在 一 些 坏 程序 被 人 尝试 执行 之 前 就 自动 
拒绝 它 。 
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注 4: 和 SmallTalk 不 同 。 
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抽象 解释 给 了 我 们 思考 程序 静态 语义 的 方式 。 程 序 注 定 要 执行 ， 因 此 一 个 程序 含义 的 标准 
解释 就 是 由 它 的 动态 语义 给 出 的 : “x=1l+2; y=x*3» 这 个 程序 通过 进行 算术 运算 并 把 它们 存 
储 在 内 存 的 某 个 地 方 来 操纵 数字 。 但 如 果 有 另 一 个 这 种 语言 的 更 抽象 语义 ， 我 们 可 以 根据 
不 同 的 规则 “执行 ”同样 的 程序 ， 并 得 到 更 抽象 的 结果 ， 这 个 结果 可 以 提供 关于 程序 在 正 
常 解释 时 所 发 生 事情 的 一 部 分 信息 。 














9.2.1 实现 

通过 为 第 2 章 的 Simple 语言 构建 一 个 类 型 系统 ， 我 们 可 以 把 这 个 思想 具体 化 。 表 面 上 ， 这 
看 起 来 很 像 2.3.2 节 中 的 大 步 操作 语义 : 将 为 每 个 表示 Simple 程序 (Number、Add 等 ) 的 语 
法 类 实现 一 个 方法 ， 而 且 调 用 这 个 方法 将 会 返回 一 个 最 终结 果 。 在 动态 语义 中 ， 这 个 方法 
叫 #evaluate， 而 且 它 的 结果 要 么 是 完全 求 过 值 的 Simple 值 ， 要 么 是 一 个 把 名 字 和 Simple 
值 关 联 起 来 的 环境 ， 这 取决 于 是 在 对 表达 式 求 值 还 是 在 对 语句 求 值 : 








>> expression = Add.new(Variable.new(:x), Number.new(1)) 


=> 《人 X + 1» 

>> expression.evaluate({ x: Number.new(2) }) 
=> «3» 

>> statement = Assign.new(:y, Number.new(3)) 


=> «y = 3» 
>> statement.evaluate({ x: Number.new(1) }) 
=> «:X=>«1», :y=>«3»} 





对 于 静态 语义 ， 我 们 将 实现 不 同 的 方法 ， 它 做 的 工作 更 少 而 且 会 返回 更 抽象 的 结果 。 这 里 
的 抽象 值 不 是 具体 的 值 和 环境 ， 而 是 类 型 。 一 个 类 型 代表 许多 可 能 的 值 : 一 个 Simple 表 
达 式 可 以 求 值 成 一 个 数 或 者 一 个 布尔 值 ， 因 此 对 于 表达 式 ， 我 们 的 类 型 将 是 “任何 数 ” 和 
“任何 布尔 值 ”。 这 些 类 型 与 之 前 看 到 的 Sign 值 类 似 ， 特 别 是 像 实 际 上 含义 是 “任何 数 ” 的 
Sign: :UNKNOWN。 就 像 Sign 那样 ， 可 以 通过 定义 一 个 叫 Type 的 类 并 创建 一 些 实例 来 引入 
类 型 ; 


























class Type < Struct.new(:name) 
NUMBER, BOOLEAN = [:number, :boolean].map { |name| new(name) } 


def inspect 
"#<Type #{name}>" 
end 
end 


新 方法 将 会 返回 类 型 ， 因 此 我 们 叫 它 其 ype。 它 应 该 回答 一 个 问题 : 这 个 Simple 语法 求 值 
的 时 候 ， 它 将 返回 哪 种 类 型 的 值 呢 ? 这 对 Simple 的 Number 和 Boolean 语法 类 很 容易 实现 ， 
因为 数字 和 布尔 值 求 值 之 后 为 自身 ， 因 此 我 们 能 准确 地 知道 将 得 到 的 值 的 类 型 : 









































class Number 
def type 
Type: :NUMBER 
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end 
end 


class Boolean 
def type 
Type: :BOOLEAN 
end 
end 


对 于 像 Add、Multiply 和 LessThan 这 样 的 操作 ， 就 要 复杂 一 点 了 。 例 如 ， 我 们 知道 对 Add 
求 值 会 返回 一 个 数 ， 而 我 们 还 知道 只 有 Add 的 两 个 参数 都 求 值 为 一 个 数 时 它 才 能 求 值 成 
功 ， 不 然 Simple 解释 器 将 会 报错 : 








>> Add.new(Number.new(1), Number.new(2)).evaluate({}) 

= 和 站 

>> Add.new(Number.new(1), Boolean.new(true)).evaluate({}) 
TypeError: true can't be coerced into Fixnum 





怎么 弄 清 楚 一 个 参数 是 否 将 求 值 成 一 个 数 呢 ? 那 是 它 的 类 型 告诉 我 们 的 。 因 此 对 于 Add， 
规则 类 似 这 样 : 如 果 两 个 参数 的 类 型 是 Type: :NUMBER， 那 最 终 的 结果 类 型 是 Type: :NUMBER; 
不 然 的 话 ， 结 果 没 有 类 型 ， 因 为 任何 试图 进行 非 数 字 加 法 的 表达 式 求 值 都 会 在 返回 任何 结 
果 之 前 失败 。 为 了 简单 ， 我 们 将 让 批 ype 方法 返回 nil 以 表明 这 个 失败 ， 在 其 他 环境 下 ， 
如 果 能 让 最 终 的 实现 更 简单 ， 我 们 可 能 会 选择 抛 出 异常 或 者 返回 某 个 特别 的 错误 值 (例如 
Type: :ERROR) 。 







































































Add 的 代码 看 起 来 像 这 样 : 


class Add 
def type 
if left.type == Type::NUMBER && right.type == Type: :NUMBER 
Type: :NUMBER 
end 
end 
end 


对 Multiply#type 的 实现 是 一 样 的 ，LessThan#type 也 非常 类 似 ， 只 是 它 会 返回 Type: :BOOLEAN 
而 不 是 Type: :NUMBER : 





class LessThan 
def type 
if left.type == Type::NUMBER && right.type == Type::NUMBER 
Type: :BOOLEAN 
end 
end 
end 





在 控制 台 上 ， 我 们 可 以 看 到 这 足以 区 分 能 成 功 求 值 和 不 能 成 功 求 值 的 表达 式 ， 而 Simple 的 
语法 两 者 都 支持 : 





>> Add.new(Number .new(1)，Number.new(2) ) .type 

=> #<Type number> 

>> Add.new(Number.new(1), Boolean.new(true)).type 

=> Nil 

>> LessThan.new(Number.new(1), Number.new(2)).type 

=> #<Type boolean> 

>> LessThan.new(Number.new(1), Boolean.new(true)).type 
=> Nil 





我 们 假设 抽象 语法 树 至 少 句 法 上 是 有 效 的 。 由 于 树叶 子 上 的 实际 值 被 静态 语 
人 义 名 咯 了 ， 所 以 #type 可 能 会 错误 预测 一 个 坏 形式 表达 式 的 求 值 行为 ， 

>> bad expression = Add.new(Number.new(true) Number.new(1) ) © 

=> «true + 1» 

>> bad expression.type 

=> #<Type number> 名 


>> bad expression.evaluate({}) 
NoMethodError: undefined method “+' for true:TrueClass © 


@ 这 个 抽象 语法 树 的 高 层 结 构 看 起 来 正确 (一 个 Add 含有 两 个 Number), 但 
第 一 个 Number 对 象 是 畸形 的 ， 因 为 它 的 值 属 性 是 true 而 不 是 Fixnum。 

外 静态 语义 假设 把 两 个 Number 加 在 一 起 总 是 产生 另 一 个 Number， 因 此 #type 
说 求 值 将 会 成 功 …… 

全 …… 但 如 果实 际 对 这 个 表达 式 求 值 ， 在 Ruby 尝试 往 true 上 加 1 的 时 候 我 
们 会 得 到 一 个 异常 。 






























































Simple 解析 器 应 该 永远 也 不 会 产生 坏 形式 的 表达 式 ， 因 此 这 在 实际 中 不 太 可 


能 是 问题 。 











这 是 之 前 加 法 、 乘 法 和 Sign 小 技巧 的 更 通用 的 版 本 。 即 使 没有 进行 任何 实际 的 加 法 或 者 数 
字 比 较 ， 静态 语义 给 了 我 们 “执行 ”程序 的 另 一 种 方式 ， 这 种 方式 仍 将 返回 有 用 的 结果 。 











我 们 没有 把 表达 式 “1+2， 解释 成 关于 值 的 程序 ， 而 是 扔 掉 一 些 细节 ， 把 它 解 释 成 关于 类 型 
的 一 个 程序 ， 而 静态 语义 提供 了 «1»、«2» 和 «+» 的 另 一 种 解释 ， 这 让 我 们 运行 这 个 关于 类 
型 的 程序 来 看 看 结果 是 什么 。 这 个 结果 没 那么 具体 ， 比 起 我 们 根据 动态 语义 正常 运行 程序 
所 得 到 的 更 抽象 ， 但 尽管 如 此 它 仍然 是 个 有 用 的 结果 ， 因 为 我 们 有 办 法 把 它 转换 成 具体 世 
界 中 有 意义 的 一 些 东 西 : Type: :NUMBER 意味 着 “在 这 个 表达 式 上 调用 #evaluate 将 会 返回 
一 个 Number”， 而 nil 的 意思 是 “调用 #evaluate 可 能 会 引起 错误 ”。 


























我 们 现在 几乎 有 了 Simple 表达 式 的 完整 静态 语义 ， 但 还 没 看 变量 呢 。Variable 毕 ype 应 该 返 
回 什么 呢 ?” 这 取决 于 变量 含有 什么 值 : 在 像 xx=5; y=x+1» 的 程序 里 ， 变 量 y 拥有 类 型 
Type: :NUMBER， 但 在 «x=5; y=x<1» 里 ， 它 的 类 型 是 Type: :BO00LEAN。 怎 么 处 理 这 种 情况 呢 ? 
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我 们 在 2.3.1 市 中 看 到 ，Variable 的 动态 语义 使 用 一 个 环境 散 列 把 变量 名 映射 到 它们 的 值 
上 ， 而 静态 语义 需要 某 种 类 似 的 东西 : 从 变量 名 到 类 型 的 映射 。 我 们 可 以 称 其 为 “类 型 环 
境 "， 但 还 是 使 用 类 型 上 下 文 这 个 名 称 以 便 避 人 免 与 这 两 种 环境 混淆 。 如 果 把 一 个 类 型 上 下 
文 传 给 Variable#type， 它 需要 做 的 就 是 在 上 下 文中 查找 这 个 变量 : 

















class Variable 
def type(context) 
context[name] 
end 
end 


这 个 类 型 上 下 文 来 自 哪 里 呢 ? 目前 ， 我 们 将 假设 它 能 通过 某 种 方式 得 到 ， 不 
心 。 管 什么 时 候 需 要 ， 都 能 通过 某 种 外 部 机 制 提供 。 例 如 ， 或 许 每 个 Simple 程序 
会 ， 都 有 一 个 头 文件 来 声明 所 有 用 到 的 变量 ， 这 个 文件 在 程序 运行 的 时 候 没 有 作 

用 ， 而 只 是 用 来 在 开发 过 程 中 与 静态 语义 进行 自动 检查 。 






































现在 其 ype 期 望 一 个 上 下 文 参数 ， 我 们 需要 回 过 头 去 修改 出 其 ype 的 另 一 个 实现 以 接受 一 
个 类 型 上 下 文 : 


class Number 
def type(context) 
Type: :NUMBER 
end 
end 


class Boolean 
def type(context) 
Type: :BOOLEAN 
end 
end 


class Add 
def type(context) 
if left.type(context) == Type::NUMBER && right.type(context) == Type: :NUMBER 
Type: :NUMBER 
end 
end 
end 


class LessThan 
def type(context) 
if left.type(context) == Type::NUMBER 8& right.type(context) == Type: :NUMBER 
Type: :BOOLEAN 
end 
end 
end 


has 





这 提供 了 包含 变量 的 表达 式 类 型 ， 只 要 给 它们 提供 一 个 正确 类 型 的 上 下 文 即 可 : 





>> expression = Add.new(Variable.new(:x), Variable.new(:y)) 


=>《X+ yy 
>> expression.type({}) 
=> ni 


>> expression.type({ x: Type::NUMBER, y: Type::NUMBER }) 


=> #<Type number> 


>> expression.type({ x: Type::NUMBER, y: Type::BOOLEAN }) 


=> ni 


这 给 了 我 们 各 种 表达 式 语法 的 楷 ype 实现 ， 





那么 语句 呢 ?” 对 一 个 Simple 语句 求 值 会 返回 一 





个 环境 ， 而 不 是 一 个 值 ， 那 么 在 静态 语义 中 如 何 表 达 呢 ? 
处 理 语句 的 最 简单 方式 就 是 把 它们 看 成 是 一 种 无 效 的 表达 式 : 假设 它们 不 返回 值 〈 这 是 真 

















的 ) 并 且 忽 略 它们 对 环境 的 影响 。 我 们 可 











以 想 出 一 个 含义 是 “不 返回 值 ”的 新 类 型 ， 并 把 





这 个 类 型 与 任何 子 部 件 有 正确 类 型 的 语句 联系 起 来 。 给 这 种 新 类 型 起 名 字 M Type: :VOID: 





class Type 
VOID = new( :void) 
end 


DoNothing 和 Sequence 的 批 ype 实现 很 简单 








单 。DoNothing 的 求 值 总 是 会 成 功 ， 只 要 连接 的 语 


名 没有 错误 ， 对 Sequence 的 求 值 就 会 成 功 : 


class DoNothing 
def type(context) 
Type: :VOID 
end 
end 


class Sequence 
def type(context) 
if first.type(context) == Type: :VOI 
Type: :VOID 
end 
end 
end 


If 和 While 则 都 含有 能 作为 条 件 的 表达 式 .， 








值 成 一 个 布尔 值 : 








class If 
def type(context) 


if condition.type(context) == Type: 


consequence.type(context) == Typ 
alternative.type(context) == Typ 
Type: :VOID 
end 
end 
end 


D 8& second.type(context) == Type::VOID 


而 且 为 了 让 程序 能 工作 正常 ， 这 个 条 件 必须 求 


:BOOLEAN && 
e::VOID && 
e: :VOID 
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class While 
def type(context) 


if condition.type(context) == Type::BOOLEAN && body.type(context) == Type: :VOID 


Type: :VOID 
end 
end 
end 





这 让 我 们 能 区 分 求 值 过 程 中 会 出 错 和 不 会 出 错 的 语句 : 


>> If.new( 
LessThan.new(Number.new(1), Number.new(2)), DoNothing.new, 
) .type({}) 
=> #<Type void> 
>> If.new( 


DoNothing.new 


Add.new(Number.new(1), Number.new(2)), DoNothing.new, DoNothing.new 


) .type({}) 


=> nil 


>> While.new(Variable.new(:x), DoNothing.new).type({ x: Type::BOOLEAN }) 


=> #<Type void> 


>> While.new(Variable.new(:x), DoNothing.new).type({ x: Type::NUMBER }) 


和 二 


a 











唯一 还 没 实现 的 方法 就 是 Assign#type。 我 们 知道 它 应 该 返回 Typ 





Type: :VOID 和 nil 在 这 里 有 不 同 的 含义 。 柱 ype 返回 Type: :VOID 的 时 候 ， 意 
， 思 是 “这 个 代码 很 好 只 是 没 设 返 回 值 * ，nil 意思 是 “这 个 代码 含有 错误 。” 


e: :VOID， 但 在 什么 环境 


下 呢 ? 如 何 决 定 一 个 赋值 行为 是 否 良好 呢 ? 想 要 根据 静态 语义 检查 赋值 语句 右 侧 的 表达 式 


是 否 合理 ， 但 关心 它 是 什么 类 型 吗 ? 





这 些 问 题 让 我 们 要 对 什么 应 该 是 有 效 的 Simple 程序 做 出 一 些 设计 决策 。 例 如 ，«x=1; y=2; 
x=Xx<y”》 可 以 吗 ? 根据 动态 语义 它 当 然 没 问题 一 一 在 它 执行 的 时 候 不 会 发 生 什 么 坏事 一 一 
但 我 们 可 能 (或 者 可 能 不 ! ) 对 变量 在 执行 中 从 持 有 一 种 类 型 的 值 转 为 持 有 另 一 种 类 型 的 




















值 感到 不 舒服 。 这 种 灵活 性 可 能 对 一 些 程序 员 有 价值 ， 但 对 其 他 人 则 可 能 是 意外 错误 的 


来 源 。 











从 设计 静态 语义 的 人 的 角度 来 说 ， 处 理 一 种 变量 类 型 可 以 改变 的 语言 也 更 困难 。 到 目前 为 
止 我 们 假设 类 型 的 上 下 文 来 自 外 部 并 在 整个 程序 中 不 做 改变 。 但 可 以 选择 一 个 更 复杂 的 系 
统 ， 这 个 系统 的 上 下 文 在 程序 的 开头 是 空 的 ， 而 上 下 文 随 着 变量 的 声明 和 赋值 逐渐 构建 起 
来 。 这 种 方式 与 随 着 程序 的 执行 动态 语义 逐渐 构建 起 值 的 环境 一 样 。 但 这 样 很 复杂 : 如 果 
语句 能 改变 类 型 上 下 文 ， 那 将 需要 机 ype 方法 既 返 回 一 个 类 型 又 返回 一 个 上 下 文 ， 这 种 方 
式 与 动态 语义 的 #reduce 方法 返回 一 个 规约 的 程序 和 一 个 环境 一 样 ， 是 为 了 一 个 之 前 的 语 
句 能 把 一 个 更 新 后 的 上 下 文 传 给 后 面 。 我 们 还 需要 处 理 类 似 «if(b){x=1}else{y=2}» 的 情 
况 ， 这 里 不 同 的 执行 路 径 会 产生 不 同 的 类 型 上 下 文 ， 还 有 像 «if(b){x=1}else{x=true}» 这 


























种 情况 ， 这 里 不 同 的 上 下 文 之 间 会 彼此 冲突 。” 





根本 上 说 ， 一 个 类 型 系统 的 限制 性 和 我 们 能 在 其 中 写 的 程序 的 表达 力 之 间 存 在 矛盾 。 一 个 
限制 性 类 型 系统 可 能 是 好 的 ， 因 为 它 保证 排除 了 大 量 可 能 的 错误 ， 但 当 它 阻止 我 们 写 想 要 
写 的 程序 时 它 又 是 坏 的 。 一 个 好 的 类 型 系统 会 在 限制 性 和 表达 力 之 间 找 到 可 接受 的 妥协 方 























式 ， 在 保持 让 程序 员 容 易 理 解 的 同时 排除 足够 的 问题 是 值得 的 。 
通过 坚持 简单 的 思想 就 可 以 解决 这 个 矛盾 : 类 型 上 下 文 由 程序 自身 之 外 的 
































什么 东西 提供 ， 





而 不 能 被 自身 的 语句 修改 。 这 样 确实 会 排除 某 些 类 型 的 程序 ， 而 且 明 确 回避 了 类 型 上 下 文 
从 何 而 来 以 及 如 何 得 来 的 问题 ， 但 它 保持 了 静态 语义 的 简单 性 并 且 给 出 了 一 个 容易 遵守 的 





规则 。 


那么 对 于 赋值 语句 ， 我 们 说 表达 式 的 类 型 应 该 与 被 赋值 的 变量 类 型 一 致 





class Assign 
def type(context) 
if context[name] == expression.type(context) 
Type: :VOID 
end 
end 
end 


对 可 以 决定 每 个 变量 的 类 型 并 让 它 保持 不 变 的 所 有 程序 ， 这 个 规则 足够 好 ， 
忍受 的 约束 。 例 如 ， 可 以 检查 在 第 2 章 中 实现 了 静态 语义 的 While 循环 : 
>> statement = 
While.new( 


LessThan.new(Variable.new(:x), Number.new(5)), 
Assign.new(:x, Add.new(Variable.new(:x), Number.new(3))) 











=> «while (x < 5){x=x+3}» 

>> statement.type({}) 

=> nil 

>> statement.type({ x: Type::NUMBER }) 
=> #<Type void> 

>> statement.type({ x: Type::BOOLEAN }) 
=> ni 


9.2.2 ”好 处 和 限制 


也 是 一 个 可 以 


已 经 构建 的 类 型 系统 可 以 避免 基本 的 错误 。 通 过 根据 这 些 静 态 语句 运行 一 个 程序 的 玩具 版 
本 ， 可 以 弄 清 楚 在 原始 的 程序 中 每 一 个 点 上 可 以 出 现 什么 类 型 的 值 ， 并 检查 这 些 类 型 与 我 




















们 运行 它 的 动态 语义 将 要 尝试 做 的 是 否 正确 匹配 。 这 个 玩具 版 本 解释 的 简 


性 意味 着 我 们 





只 能 得 到 程序 求 值 时 可 能 发 生 的 事情 的 有 限 信息 ， 但 它 还 意味 着 我 们 很 容易 进行 检查 。 例 





如 ， 可 以 检查 一 个 永远 运行 的 程序 : 




















注 5: 一 个 简单 的 解决 办 法 是 : 让 类 型 系统 只 在 它 的 执行 路 径 产 生 同 样 上 下 文 的 时 候 才 接受 语句 。 





在 “玩偶 国 ” 中 编程 | 281 





>> statement = 
Sequence.new( 
Assign.new(:x, Number.new(0)), 
While.new( 
Boolean.new(true), 
Assign.new(:x, Add.new(Variable.new(:x), Number.new(1))) 
) 
) 
=> «x = 0; while (true) {xX=x+1}» 
>> statement.type({ x: Type::NUMBER }) 
=> #<Type void> 
>> statement.evaluate({}) 
SystemStackError: stack level too deep 








这 个 程序 确实 很 人 ,但 它 没 包含 任何 类 型 错误 : 循环 条 件 是 一 个 布尔 值 ， 并 且 变 量 x 也 一 
直 用 来 存储 一 个 数 。 当 然 ， 类 型 系统 不 够 聪明 ， 没 能 告诉 我 们 一 个 程序 是 否 在 做 我 们 想 要 
它 干 的 事情 ， 甚 至 是 否 在 做 有 用 的 事情 ， 而 只 告诉 我 们 它 的 各 个 组 成 部 分 是 否 以 正确 的 方 
式 匹 配 了 。 但 因为 它 需 要 是 安全 的 〈 就 像 Sign 抽象 一 样 )， 所 以 有 时 候 对 一 个 程序 是 否 含 
有 任何 错误 会 给 出 过 于 悲观 的 答案 。 如 果 用 额外 的 一 个 语句 扩展 上 面 的 程序 ， 我 们 就 能 
出 这 一 点 来 : 











>> statement = Sequence.new(statement, Assign.new(:x, Boolean.new(true))) 
=> «x = 0; while (true) { x=x+1}; x = true» 

>> statement.type({ x: Type::NUMBER }) 

=> Nil 








方法 楷 ype 返回 nil 表明 有 错误 ， 因 为 存在 一 个 把 布尔 值 赋 给 x 的 语句 ， 可 是 这 个 语句 永 
远 不 会 执行 ， 所 以 在 运行 时 不 会 实际 引发 一 个 问题 。 我 们 的 类 型 系统 没有 那么 聪明 ， 认 识 
不 到 这 一 点 ， 但 它 给 出 了 一 个 安全 的 答案 :“ 这 个 程序 可 能 会 出 错 。 这 过 于 小 心 但 并 没有 
错误 。 有 时 候 在 程序 中 试图 把 一 个 布尔 值 赋 给 一 个 数字 变量 确实 有 可 能 出 错 ， 但 因为 某 种 
原因 ， 它 实际 上 不 会 出 错 。 


并 不 仅仅 是 无 限 循环 会 引起 问题 。 像 下 面 这 个 程序 的 动态 语义 就 没有 问题 : 




















>> statement = 
Sequence.new( 
If.new( 
Variable.new(:b), 
Assign.new(:x, Number.new(6)), 
Assign.new(:x, Boolean.new(true)) 
)， 
Sequence .new( 
If.new( 
Variable.new(:b)， 
Assign.new(:y, Variable.new(:x)), 
Assign.new(:y, Number.new(1)) 


Assign.new(:z, Add.new(Variable.new(:y), Number.new(1))) 
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) 
=> kif (b) {x=6}else{x= true}; if (bD){y=x}else{y=1};zZ=Yy+1» 
>> statement.evaluate({ b: Boolean.new(true) }) 
=> {:b=>«true», :X=>«6», :y=>«6», :Z=>«7»} 
>> statement.evaluate({ b: Boolean.new(false) }) 
=> {:b=>«false», :Xx=>«true»y, :y=>«1», :z=>«2»} 


变量 x 根据 b 是 true 或 者 false 决定 来 存储 一 个 数字 还 是 一 个 布尔 值 ， 这 在 求 值 过 程 中 从 
来 都 不 是 问题 。 因 为 程序 会 一 致 地 使 用 一 个 或 者 另 一 个 ;没有 可 能 的 执行 路 径 会 让 x 既 被 
处 理 成 一 个 数 又 被 处 理 成 一 个 布尔 值 。 但 静态 语义 使 用 的 抽象 值 没有 足够 的 细节 ， 不 能 
示 出 这 样 是 可 以 的 “， 因 此 安全 的 近似 总 是 会 说 “这 个 程序 可 能 会 出 错 ”: 
>> statement.type({}) 
=> Nil 
>> context = { b: Type::BOOLEAN, y: Type::NUMBER, z: Type::NUMBER } 
=> {:b=>#<Type boolean>, :y=>#<Type number>, :z=>#<Type number>} 
>> statement.type(context) 
=> Nil 
>> statement.type(context.merge({ x: Type::NUMBER })) 
=> Nil 
>> statement.type(context.merge({ x: Type::BOOLEAN })) 
=> Nil 


这 是 一 个 静态 类 型 系统 (static type system)， 为 了 在 运行 前 就 对 程序 进行 检 
心 。 查 而 设计 ， 在 一 个 静态 类 型 语言 中 ， 每 一 个 变量 都 有 相关 的 类 型 。Ruby 的 
' 动态 类 型 系统 (dynamic type system) 工作 方式 不 同 , 变量 没有 类 型 ， 而 值 
的 类 型 只 是 在 程序 执行 过 程 中 它们 实际 使 用 时 才 会 检查 。 这 让 Ruby 可 以 处 
理 赋值 给 同一 变量 的 不 同类 型 的 值 ， 代 价 就 是 在 程序 执行 前 不 能 检查 出 类 型 
的 bug 来 。 

















这 个 系统 专注 于 编程 中 某 种 特定 方式 的 错误 : 每 一 段 语 法 的 动态 语义 对 其 将 要 处 理 的 值 的 
类 型 是 有 某 种 期 望 的 ， 而 类 型 系统 检查 那些 期 望 ， 以 便 保证 在 期 望 为 布尔 值 的 时 候 不 要 出 
现 数 字 ， 反 过 来 期 望 为 数字 的 时 候 不 要 出 现 布 尔 值 。 但 一 个 程序 还 存在 其 他 的 犯错 方式 ， 
而 这 个 静态 语义 并 不 对 其 进行 检查 。 例 如 ， 这 个 类 型 系统 不 会 注意 到 一 个 变量 在 使 用 之 前 
是 否 已 经 被 实际 赋值 了 ， 因 此 任何 包含 未 初始 化 变量 的 程序 都 能 通过 这 个 类 型 检查 器 ， 但 
在 求 值 过 程 中 则 会 失败 。 




















>> statement = Assign.new(:x, Add.new(Variable.new(:x), Number.new(1))) 
=> «X =X+ 1» 

>> statement.type({ x: Type::NUMBER }) 

=> #<Type void> 

>> statement.evaluate({}) 

NoMethodError: undefined method “value' for nil:NilClass 




















注 6: 在 这 种 情况 下 ， 细 市 是 x 的 类 型 依赖 于 b 的 值 。 我 们 的 类 型 不 含有 关于 变量 具体 值 的 任何 信息 ， 从 而 
它们 无 法 表达 类 型 和 值 的 依赖 。 
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我 们 从 类 型 系统 得 到 的 任何 信息 都 有 些 可 疑 ， 并且 在 决定 对 其 投入 多 大 的 信任 时 得 注意 它 
的 限制 。 程 序 静 态 语 义 的 一 次 成 功 执 行 并 不 意味 着 “这 个 程序 将 肯定 起 作用 ”， 只 是 表明 
“这 个 程序 在 一 种 特定 的 方式 下 肯定 不 会 报错 "。 能 有 一 个 自动 化 的 系统 告诉 我 们 程序 没有 
潜在 的 bug 或 者 错误 当然 很 好 ， 但 就 像 在 第 8 章 看 到 的 那样 ， 世 界 就 是 没 那 么 方便 。 


9.3 ”应 用 


本 章 已 经 概括 了 抽象 解释 的 基本 思想 : 使 用 代价 低 的 近似 来 了 解 代价 高 的 计算 ， 并 展示 了 
一 个 简单 类 型 系统 作为 例子 说 明 近 似 对 分 析 程 序 是 很 有 用 的 。 

我 们 对 抽象 解释 的 讨论 非常 不 正式 。 正 式 来 讲 ， 抽 象 解释 是 一 种 数学 化 的 技术 ， 同 样 语言 
的 不 同 语义 通过 函数 连接 到 一 起 ， 这 些 函 数 把 具体 值 的 集合 转换 成 抽象 值 的 集合 ， 反 之 亦 
然 。 这 就 允许 抽象 程序 的 结果 和 性 质 可 以 按照 具体 程序 的 方式 来 理解 。 






























































这 项 技术 一 个 著名 的 工业 级 应 用 是 Astrke 静态 分 析 器 (http://www.astree.ens/fr/)， 它 使 用 
抽象 解释 自动 证 明 一 个 C 程序 没 有 像 被 零 除 、 数 组 越界 和 整数 溢出 这 样 的 运行 时 错误 。 
Astrée 不 仅 已 经 用 来 验证 为 国际 空间 站 运送 补给 的 儒 勒 " 几 尔 纳 (Jules Verne) ATV-001 
任务 的 自动 对 接 软件 ， 还 被 用 来 验证 空 客 A340 和 A380 飞机 的 飞行 控制 软件 。 抽 象 解释 
通过 提供 安全 的 近似 而 不 是 有 保证 的 答案 来 遵循 Rice 理论 ， 因 此 Astrke 有 可 能 报告 实际 
不 存在 的 运行 时 错误 〈 错 误 警 告 ) ; 实际 上 ， 它 的 抽象 在 验证 A340 软件 时 准确 到 足以 避 
免 任 何 错误 的 警告 。 


用 Simple 语言 写 的 程序 只 能 操纵 基本 的 值 (数字 和 布尔 值 )， 因 此 本 章 的 类 型 都 很 基本 。 
现实 中 的 编程 语言 会 处 理 很 多 种 值 ， 因 此 真实 的 静态 类 型 系统 要 更 复杂 。 例 如 ， 像 ML 和 
Haskell 这 样 的 静态 类 型 函数 式 编程 语言 中 函数 也 是 值 ( 就 像 Ruby 的 proc) ， 因 此 它们 的 类 
型 系统 支持 总 数 类 型 。 意 思 就 像 “ 带 有 两 个 数字 参数 并 返回 一 个 布尔 值 的 函数 "， 可 以 让 类 
型 检查 器 校 验 到 一 个 函数 调用 中 用 到 的 参数 与 函数 定义 的 参数 匹配 。 





















































类 型 系统 还 可 以 携带 其 他 信息 : Java 有 一 个 类 型 与 影响 系统 (type and effect system) 不 只 
跟踪 方法 参数 和 返回 值 的 类 型 ， 还 会 跟踪 能 由 方法 体 抛 出 的 受 检 异 常 (checked exception， 
殷 出 一 个 异常 是 一 个 影响 ) ， 用 来 保证 所 有 可 能 的 异常 要 么 被 处 理 掉 要 么 被 传播 出 去 。 

















这 是 我 们 计算 理论 之 旅 的 终点 了 。 我 们 设计 了 不 同 能 力 的 语言 和 机 器 ， 从 不 同 寻常 的 系统 
中 梳理 出 计算 ， 然 后 一 头 扎 到 计算 机 编程 的 理论 限制 当中 。 


除了 探索 特定 的 机 器 和 技术 之 外 ， 我 们 还 看 到 了 一 些 更 通用 的 思想 。 














任何 人 都 可 以 设计 和 实现 一 种 编程 语言 。 语 法 和 语义 的 基本 思想 是 简单 的 ，Treetop 这 
样 的 工具 可 以 处 理 枯 燥 的 细节 。 

每 一 个 计算 机 程序 都 是 一 个 数学 对 象 。 按 句法 来 说 ， 一 个 程序 只 是 一 个 大 数 ， 语义 上 来 
说 ， 它 可 能 代表 一 个 数学 国 数 ， 或 者 一 个 能 被 形式 化 规约 规则 操纵 的 分 层 结构 。 这 意味 
着 数学 上 的 许多 技术 和 成 果 ， 如 Kleene 规约 理论 或 者 G6del 不 完备 定理 ， 都 能 等 价 地 
应 用 到 程序 上 。 

计算 ， 最 初 被 描述 为 只 是 “一 台 计 算 机 做 的 事 ”， 已 经 被 证 明 是 某 种 自然 力量 。 很 容易 
把 计算 想象 为 一 个 复杂 的 人 类 发 明 ， 它 只 能 由 对 许多 复杂 部 分 进行 特殊 设计 的 系统 来 执 
行 ， 但 在 系统 中 还 可 以 看 到 支持 它 设 那么 复杂 。 因 此 ， 计 算 不 是 一 个 枯燥 的 只 是 发 生 在 
微 处 理 器 中 的 人 工 过 程 ， 而 是 一 个 在 许多 不 同 地 点 以 不 同方 式 发 生 的 普遍 现象 。 

计算 不 是 全 有 或 全 无 的 。 不 同 的 机 器 拥有 不 同 的 计算 能 力 , 这 给 了 我 们 用 途上 的 连续 性 : 
DFA 和 NFA 有 有 限 的 能 力 ，DPDA 更 强大 ，NPDA 还 更 强大 ， 而 图 灵机 是 我 们 知道 的 
最 强大 的 机 器 。 

抽象 的 编码 和 级 别 对 于 利用 计算 能 力 必 不 可 少 。 计 算 机 是 维护 抽象 宝塔 的 机 器 ， 从 非常 
低层 次 的 半导体 物理 学 开始 ， 上 升 到 层次 高 得 多 的 多 点 触 控 图 形 用 户 界 面 。 为 了 让 计算 
有 用 ， 我 们 需要 能 把 现实 世界 中 复杂 的 思想 编码 成 机 器 能 处 理 的 更 简单 的 形式 ， 然 后 再 
把 结果 解码 回 有 意义 的 高 层 表 示 。 
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。 计算 能 做 的 事情 是 有 限制 的 。 我 们 不 知道 如 何 构建 比 图 灵机 能 力 更 强 的 机 器 ， 但 确实 存 
在 图 灵机 无 法 解决 的 问题 ， 而 这 些 问题 包括 发 现 我 们 所 写 程序 的 信息 。 可 以 利用 模糊 的 
或 者 不 完整 的 答案 处 理 这 些 限 制 ， 以 便 质 疑 我 们 程序 的 行为 。 


这 些 思想 可 能 不 会 立即 改变 你 工作 的 方式 ， 但 我 希望 它们 已 经 满足 了 你 的 某 种 好 奇 心 ， 并 
且 能 帮助 你 享受 在 宇宙 中 实现 计算 时 所 度 过 的 时 光 。 
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真正 理解 自己 的 代码 是 如 何 运行 的 吗 ? 

如 采 你 想像 “大 牛 ” 级 的 程序 员 一 样 做 开发 ， 或 者 想 摆脱 自己 半 
路 出 家 的 知识 “ 回 ” 境 ， 本 书 能 够 为 你 真正 讲 明白 计算 理论 和 编 
程 语言 的 工作 原理 与 真切 含义 。 本 书 使 用 简单 的 Ruby 代 码 做 示 
例 ， 没 有 枯燥 难 记 的 数学 符号 。 作 者 极力 推崇 循序 渐进 和 从 实践 
中 学 习 ， 他 从 机 器 、 语 言 讲 到 程序 ， 又 一 路 从 最 简单 的 机 器 (有 
限 自动 机 ) 过 渡 到 复杂 的 机 器 (图 灵机 ) ， 从 设计 实现 简单 的 编 
程 语言 到 极 简 的 机 器 ， 而 后 又 推理 所 谓 “ 不 可 能 ”解决 的 问题 ， 
为 读者 完美 打造 了 轻松 有 趣 的 阅读 体验 。 
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曙 停机 和 自 引用 为 何 会 让 计算 问题 无 解 
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